Lanjut ke materi selanjutnya Pentaho.....kita latihan tentang Pentaho dan Mysql ....
terlebih dahulu kita jalankan service Pentaho hasil instalasi kemarin:
Dari menu run ketik pentaho maka akan muncul menu sbb: lalu klik
Lalu akan muncul aplikasi Pentaho:
Atau dari hasil downloadan trus jalankan apliaksinya dengan cara klik spoon.bat
loaksinya dimari:
C:\Pentaho\design-tools\data-integration
Misalkan didapat data xml sbb
<?xml version="1.0" encoding="UTF-8"?>
<data>
<row>
<propinsi>Bali</propinsi>
<ibukota>Denpasar</ibukota>
<populasi>491500</populasi>
</row>
<row>
<propinsi>Nusa Tenggara Barat</propinsi>
<ibukota>Mataram</ibukota>
<populasi>356141</populasi>
</row>
<row>
<propinsi>Nusa Tenggara Timur</propinsi>
<ibukota>Kupang</ibukota>
<populasi>269680</populasi>
</row>
<row>
<propinsi>Maluku</propinsi>
<ibukota>Ambon</ibukota>
<populasi>428585</populasi>
</row>
<row>
<propinsi>Maluku Utara</propinsi>
<ibukota>Sofifi</ibukota>
<populasi>163467</populasi>
</row>
<row>
<propinsi>Papua</propinsi>
<ibukota>Jayapura</ibukota>
<populasi>197396</populasi>
</row>
<row>
<propinsi>Papua Barat</propinsi>
<ibukota>Manokwari</ibukota>
<populasi>207398</populasi>
</row>
</data>
Selanjutnya untk menampilkan di Pentaho langkahnya adalah sbb;
masuk ke tiap2 bagian di atas pilih browse/ add arahkan ke file xml kita ....
pada bagian ms excel output isikan nama file hasil keluarannya: misal out.xls
Lalu jalankan RUN
HASILNYA:
hasil excel nya sbb;
Hm...mudah yaaaaaaaaaaaaaaaaaaaa
Rabu, 13 Desember 2017
Sabtu, 25 November 2017
Install Pentaho Versi 8
Online Analytical Processing, atau disingkat OLAP
Adalah metode pendekatan untuk menyajikan jawaban dari permintaan proses analisis yang bersifat dimensional secara cepat,
yaitu desain dari aplikasi dan teknologi yang dapat
+mengoleksi,
+menyimpan,
+memanipulasi suatu data multidimensi untuk tujuan analis.
OLAP adalah bagian dari kategori yang lebih global dari pemikiran bisnis, yang juga merangkum hubungan antara pelaporan dan penggalian data.
Aplikasi khusus dari OLAP adalah pelaporan bisnis untuk penjualan, pemasaran, manajemen pelaporan, manajemen proses bisnis (MPB), penganggaran dan peramalan, laporan keuangan dan bidang-bidang yang serupa.
Istilah OLAP merupakan perampingan dari istilah lama :
database OLTP (Online Transaction Processing).
Secara singkat OLAP adalah suatu proses yang digunakan untuk melakukan permintaan terhadap data dalam bentuk yang kompleks dan menganalisa data yang bervolume besar.
maka dari itu OLAP seringkali disebut analisis data multidimensi.
Online Transaction Processing atau sering dikenal dengan OLTP adalah sistem yang berorientasi proses yang memproses transaksi secara langsung melalui komputer yang terhubung dalam jaringan.
Misalnya biasa digunakan pada sebuah supermarket, kasir menggunakan mesin dalam proses transaksinya. OLTP mempunyai karakteristik beberapa user dapat creating, updating, retrieving untuk setiap record data, OLTP sangat optimal untuk updating data.
Secara singkat OLTP adalah segala penanganan dalam proses transaksi sehari-hari, misalkan sebuah toko Araycom yang menangani ransaksi pembelian setiap harinya, bayangkan ada berapa banyak transaksi input ke dalam database? pasti banyak sekali. lantas apakah data transaksi tersebut akan di diamkan menumpuk sampai berbulan-bulan bahkan bertahun-tahun? disinilah OLAP berperan.
Pada OLAP biasanya digunakan untuk pengambilan suatu keputusan,
misalkan sebagai contoh Manager di Araycom ingin melihat data transaksi perbulan, per 3 bulan atau bahkan per tahun untuk pengambilan keputusan barang apa saja yang paling laku dijual da barang apa saja yang tidak laku di pasar.
Perbedaan OLTP dan OLAP
1.OLTP (Online Transaction Processing)
fungsi aplikasi OLTP merupakan satu aplikasi yang berguna untuk mendukung operasional perusahaan sehari-hari. Contohnya adalah aplikasi untuk merekam pesanan konsumen, merekam pembelian, merekam proses produksi, merekam penggajian karyawan dan lain sebagainya. Aktivitas pemrosesan transaksi, biasanya hanya melibatkan beberapa record.
Sebagai contoh, dalam aplikasi untuk merekam pesanan konsumen, aplikasi akan mengakses data dari tabel Konsumen, tabel Pesanan Konsumen, tabel Detail Pesanan, tabel Persediaan dan tabel Karyawan.
Setiap tabel memiliki kunci yang berguna untuk sarana relasi antar tabel. Aplikasi pesanan konsumen, hanya akan menambahkan beberapa baris baru dalam tabel Pesanan Konsumen dan tabel Detail Pesanan.
desine database Desain dalam OLTP bersifat Entity Relational atau databasenya dinormalisasi dulu sebelum digunakan. Database untuk mendukung OLTP adalah database yang normal. Normalized dengan banyak table. OLTP mengunakan data model ER untuk melihat transaksi sebagai proses model yang tunggal dan sinormalisaionel untuk menjagaintegritas data.
OLTP menjadi bentuk yg lebih mudah untuk di ambildan di analisis. rancangan OLTP mengharuskan perancangan logika tabel dan tipe query secara bersama-sama agar tabel tersebut dapat terakses dengan cepat.
Berdasarkan sumber data Data Operasional, data OLTP adalah data asli. Dalam OLTP datanya adalah hari ini, update setiap saat (datanya dapat di-edit, di-ganti, atau di-hapus) d. Berdasarkan Tujuan datanya Untuk mengendalikan dan menjalankan tugas2 utama. Penggunaan OLTP digunakan setiap saat.
Berdasarkan Data apa yg di tampilkan Bisnis proses yg berkelajutan.
Query yg digunakan Simple Query.
Kecepatan proses Pada dasarnya sangat cepat
Data diorganisasikan berdasarkan fungsi atau operasi seperti penjualan, produksi,dan pemrosesan pesanan.
Space yg dibutuhkan Relativ kecil.
Data bisa saja disimpan pada beberapa platform
Pemrosesan bersifat berulang
User Melayani banyak pemakai operasional User. Dalam OLTP, penggunanya adalah IT Proffesional. Jumlah Pengguna Untuk OLTP penggunanya adalah puluhan.
Ukuran Database Ukuran database untuk OLTP sekitar MB-GB. l. Access OLTP aksesnya bisa write, read dan lain-lain. Jumlah rekaman yang di akses OLTP sekitar ratusan sampai ribuan.
Unit Pekerjaan OLTP pekerjaannya hanya sederhana misalnya transaksi dalam swalayan. Seperti misalanya kasir pada sebuah super market yang menggunakan mesin dalam proses transaksinya.
2. OLAP (OnLine Analytical Processing)
Fungsi aplikasi OLAP digunakan untuk pengambilan keputusan. Aplikasi OLAP berfungsi untuk mengakses data yang besar (kalau perlu data selama empat atau bahkan lima tahun).
OLAP bergunauntuk menganalisis hubungan antar data guna menemuka ada tidak pola tertentu dalam data yang berguna untuk pengambilan keputusan di masa yang akan datang. Sebagai contoh, dengan menganalisis data di masa lalu, aplikasi OLAP berhasil mengidentifikasi produk apa yang disukai di daerah tertentu (ternyata ada perbedaan preferensi konsumen antar wilayah pemasaran).
D
esine database Sedangkan database yang pas untuk mendukung OLAP adalah database yang denormalisasi. De-normalized dengan sedikit table dan menggunakan star / showflake schemas. olap menggunakan dimensional mode. perancangan dan penerapan dimensional model dilakukan pada data warehouse untuk di ambil dianalisis oleh olap.
Dimensional model merupakan permodalan data yang terdiri dari tabel dimensi dan tabel fact yg relasianya dapat di gambarkan pada star scema, tabel flact merupakan tabel utama dalam dimensional model yang berisi pengukuran nilai angka dari bisnis yang di simpan. tabel dimensi merupakan tabel perlengkapan dari tabel fact yg berisi penjelasan tekstuan dari bisnis. Keuntungan dari dimensional model ialah memisahkan rancangan logika tabel dengan tipe query yang di gunakan pengguna. keuntungan lainya pengguna dimensional model ialah kemudahan pengawasan terhadap penambahan data kemudian penambahan kolom dan rancangan baru serta menagani pergantian kebutuhan bisnis,
Berdasarkan sumber data Data konsolidasi, data OLAP di peroleh dari beberapa OLTP. datanya adalah sekarang dan hari ini yang berguna untuk melakukan analisis ke depan.
Berdasarkan Tujuan datanya Untuk membantu dalam perencanaan, memecahkan masalah dan mendukung keputusan. Untuk mendukung keputusan harian (operasional). biasanya OLAP digunakan seperlunya saja.
Berdasarkan Data apa yg di tampilkan Menampilkan data dari berbagai macam aktivitas bisnis. Berorientasi pada transaksi.
Query yg digunakan Complex Queries.
Kecepatan proses Tergantung dari data yg dilibatkan, proses akan lebih cepat dengan menggunakan fungsi indexing.
Space yg dibutuhkan Lebih besar, karena membutuhkan lebih banyak indexing dibandingkan OLTP.
Kemampuan OLAP Konsolidasi melibatkan pengelompokan data. Sebagai contoh kantor-kantor cabang dapat dikelompokkan menurut kota atau bahkan propinsi. Transaksi penjualan dapat ditinjau menurut tahun, triwulan, bulan, dan sebagainya. Kadangkala istilah rollup digunakan untuk menyatakan konsolidasi j. User OLAP penggunanya adalah Knowledge worker maksdunya penggunanya adalah seorang yang bertindak dalam subyek tertentu, atau petinggi dalam suatu perusahaan. Jumlah Pengguna Untuk OLAP penggunanya bisa sampai ratusan bahkan ribuan.
Ukuran Database Ukuran database untuk OLAP bisa sampai GB- l. Access aksesnya OLAP sering dibaca karena digunakan untuk analisa. Jumlah rekaman yang di akses OLAP data yang diakses bisa sampai jutaan bahkan milyaran.
Unit Pekerjaan Untuk OLAP query untuk menampilkan data sangat kompleks. yang merupakan bagian dari Business Intelligencey yang berguna untuk menyediakan laporan analisis, seperti penjualan, marketing, BPM (Business Process Management), budgeting, forecasting, keuangan dan sebagainya. model multidimensi, yang mengijinkan query analisis yang kompleks dengan kecepatan eksekusi yang tinggi.
Ref: http://dwikajunata.blogspot.co.id/2015/09/v-behaviorurldefaultvmlo.html
+++++++++++++++++++++++++++++++++++++++++++++++++
Kali ini kita coba Pentaho yang versi baru: silakan download dimari : http://www.pentaho.com/download
gambar 1. menu download

gambar 3. tampilan awal installasi
gambar 4. konfirmasi eksekusi
gambar 5. lokasi hasil installasi
gambar 6. verifikasi login admin
gambar 7. lanjutkan
gambar 8. sukses installasi
gambar 9. Selamat Datang di MenuAwal Pentaho
Jumat, 24 November 2017
Pentaho Membaca File Text Tidak Terstruktur
Contoh data :
Propinsi: Kalimantan Barat
Ibu kota: Pontianak
Populasi: 516737
Propinsi: Kalimantan Tengah
Ibu kota: Palangka Raya
Populasi: 168449
Gubernur: Agustin Teras Narang
Wakil Gubernur: Achmad Diran
Propinsi: Kalimantan Selatan
Ibu kota: Banjarmasin
Populasi: 693566
Propinsi: Kalimantan Timur
Ibu kota: Samarinda
Luas wilayah (km2): 204534
Populasi: 727500
Propinsi: Kalimantan Timur
Propinsi: Kalimantan Utara
Populasi: 622350
Ibu kota: Tanjung Selor
Merupakan provinsi termuda Indonesia
Pemisah antar data adalah enter /data kosong
Sehingga Pengaturannya adalah sbb:
File Type=csv
matikan header
No empty row = matikan fitur ini agar step text file input juga menganggap baris kosong sebagai data. Dan baris kosong ini akan kita gunakan sebagai indikator pemisah data.
saat kita klik tombol Field->Get Field yang terjadi adalah data masih bergabung dalam 1 field
dengan data sbb:
Jika diamati pemisah antar data adalah null atau baris kosong....
Drag n Drop pada group Scripting -> Modified Java Script Value
Tambahkan code sbb pada Modified Java Script Field1
//Script here
var group;
if(getProcessCount('r')==1){
group=1;
};
if(Field1==null){
group++;
}
Lalu tekan Get Variabel dan berikan tipe data Integer
Propinsi: Kalimantan Barat
Ibu kota: Pontianak
Populasi: 516737
Propinsi: Kalimantan Tengah
Ibu kota: Palangka Raya
Populasi: 168449
Gubernur: Agustin Teras Narang
Wakil Gubernur: Achmad Diran
Propinsi: Kalimantan Selatan
Ibu kota: Banjarmasin
Populasi: 693566
Propinsi: Kalimantan Timur
Ibu kota: Samarinda
Luas wilayah (km2): 204534
Populasi: 727500
Propinsi: Kalimantan Timur
Propinsi: Kalimantan Utara
Populasi: 622350
Ibu kota: Tanjung Selor
Merupakan provinsi termuda Indonesia
Pemisah antar data adalah enter /data kosong
Sehingga Pengaturannya adalah sbb:
File Type=csv
matikan header
No empty row = matikan fitur ini agar step text file input juga menganggap baris kosong sebagai data. Dan baris kosong ini akan kita gunakan sebagai indikator pemisah data.
saat kita klik tombol Field->Get Field yang terjadi adalah data masih bergabung dalam 1 field
dengan data sbb:
Jika diamati pemisah antar data adalah null atau baris kosong....
Drag n Drop pada group Scripting -> Modified Java Script Value
Tambahkan code sbb pada Modified Java Script Field1
//Script here
var group;
if(getProcessCount('r')==1){
group=1;
};
if(Field1==null){
group++;
}
Lalu tekan Get Variabel dan berikan tipe data Integer
Minggu, 08 Januari 2017
Pentaho Membaca File Text Terstruktur
Pentaho sering menggunakan file text sebagai masukan untuk baragam proyek ETL nya.
antara lain file text .csv atau data text berupa tabel dengan ukuran width yang sudah ditentukan
Praktik membaca file .csv
"Propinsi","Ibu Kota","Populasi"
"Aceh","Banda Aceh",223446
"Sumatera Utara","Medan",2097610
"Sumatera Barat","Padang",833562
"Riau","Pekanbaru",897767
"Jambi","Jambi",531857
"Sumatera Selatan","Palembang",1455284
"Bengkulu","Bengkulu",308544
"Lampung","Bandar Lampung",881801
"Kepulauan Bangka Belitung","Pangkal Pinang",174000
"Kepulauan Riau","Tanjung Pinang",192493
+Buat New File ->Transformation
pada bagian group input pilih Text file Input klik 2x lalu pilih browse arahkan ke file .csv
Pengaturan :
FileType=csv
Separtaor =, =>menyesuaikan dengan dokumen yang hendak di buka
Enclosure=pengapit string terkadang pengapit data atau string bisa juga kutip 1 '
Header=aktifkan karena pada dokumenpun terdapat header
No empty row=maka baris kosong akan diabaikan...
Jalankan perintah
Ouh...Mudah banget yaaaaa....lanjut....
Praktik membaca file fixed atau.txt
Propinsi Ibu Kota Populasi
Jakarta Jakarta 8839247
Yogyakarta Yogyakarta 511744
Jawa Barat Bandung 2288570
Jawa Tengah Semarang 1352869
Jawa Timur Surabaya 2611506
Banten Serang 501562
Caranya sama hanya pengaturan di atsu fixed fileType nya....
hanya saja untuk pengaturan meteran jarak antar field haris disetting manual...geser-geser......
dan.....Mudah......
antara lain file text .csv atau data text berupa tabel dengan ukuran width yang sudah ditentukan
Praktik membaca file .csv
"Propinsi","Ibu Kota","Populasi"
"Aceh","Banda Aceh",223446
"Sumatera Utara","Medan",2097610
"Sumatera Barat","Padang",833562
"Riau","Pekanbaru",897767
"Jambi","Jambi",531857
"Sumatera Selatan","Palembang",1455284
"Bengkulu","Bengkulu",308544
"Lampung","Bandar Lampung",881801
"Kepulauan Bangka Belitung","Pangkal Pinang",174000
"Kepulauan Riau","Tanjung Pinang",192493
+Buat New File ->Transformation
pada bagian group input pilih Text file Input klik 2x lalu pilih browse arahkan ke file .csv
Pengaturan :
FileType=csv
Separtaor =, =>menyesuaikan dengan dokumen yang hendak di buka
Enclosure=pengapit string terkadang pengapit data atau string bisa juga kutip 1 '
Header=aktifkan karena pada dokumenpun terdapat header
No empty row=maka baris kosong akan diabaikan...
Jalankan perintah
Ouh...Mudah banget yaaaaa....lanjut....
Praktik membaca file fixed atau.txt
Propinsi Ibu Kota Populasi
Jakarta Jakarta 8839247
Yogyakarta Yogyakarta 511744
Jawa Barat Bandung 2288570
Jawa Tengah Semarang 1352869
Jawa Timur Surabaya 2611506
Banten Serang 501562
Caranya sama hanya pengaturan di atsu fixed fileType nya....
hanya saja untuk pengaturan meteran jarak antar field haris disetting manual...geser-geser......
dan.....Mudah......
Sabtu, 07 Januari 2017
Praktik Penggunaan Variabel Pentaho
Meneruskan dari aplikasi sebelumnya...
Masuk ke group general -> drag and drop ->Set Variables letakkan pada job Hob antara Start dan Msgbox....
lalu klik dua kali dan konfigure sesuai gambar sbb:
Perintah msgbox ${namanya} adalah perintah menarik data variabel untuk di tampilkan pada msgbox
Pentaho Installasi
Pentaho Community Edition atau Pentaho BI Suite adalah produk dari Pentaho yang sudah terintegrasi dengan kemampuan reporting, dashboard, data mining, workflow, dan ETL
Berikut adalah beberapa tools yang ada pada Pentaho dan wajib dipelajari:
+Pentaho BI Server
Produk ini adalah kumpulan dari aplikasi BI yang bersifat opensource yang berjalan di atas platform Java. Di dalam produk inilah, reporting, dashboard dan data analysist ditampilkan setelah melalui tahapan desain.
+Pentaho Data Integration Pentaho Data Integration atau Kettle
Adalah tools yang memiliki kemampuan extract, transform, dan load (ETL) pada multi platform database. Script dari disain dapat disimpan dalam bentuk file ataupun repository. Selain itu, pada tools ini terdapat cukup banyak ‘steps’ untuk mengatur workflow control (JOB), dan data workflow (Transformation).
+Pentaho Analysis/Mondrian OLAP Engine
Tools ini mempunyai fungsi untuk melakukan OLAP, eksekusi MDX query, star schema, dan sebagainya.
Selain itu, tampilan datanya didukung dengan fungsi drill down dan charting dari hasil query.
+Pentaho Report Designer Tools
berbasis desktop ini berperan sebagai desain report yang hasilnya dapat dikirimkan ke Pentaho BI Server. Dengan tools ini, kita bisa mendesain report sesuai dengan kebutuhan.
+Pentaho CDF (Community Dashboard Framework) CDF adalah framework untuk membangun dashboard di atas Pentaho BI Server.
+Plugin Saiku for Data Analysis Saiku adalah plugin yang dapat diinstal di Pentaho BI Server yang berguna untuk analisis data. Saiku mempunyai kelebihan dibandingkan dengan data analisis bawaan pentaho, yaitu lebih user friendly dalam penggunaannya dan lebih baik tampilannya.
Download Installasi
Download Modul
Di dalam folder pentaho BI Server tersebut terdapat dua folder :
administration-console, dan biserver-ce.
Administrator console adalah bagian yang menangani hal-hal administrasi Pentaho (datasource, penjadwalan dan lainnya).
Sedangkan biserver-ce adalah bagian yang menangani aplikasi BI itu sendiri sebagai platformnya.
Untuk menjalankan administration-console, masuk ke folder adminsitration console lalu jalankan start-pac.bat (untuk OS Windows) atau jalankan startpac.sh (untuk OS Linux).
Sebelumnya jalankan set-pentaho-env.bat atau setpentaho-env.sh untuk konfigurasi environment secara otomatis.
Lalu buka browser dengan alamat http://localhost:8099, dengan username : admin dan password : password. Maka muncul tampilan dari administration-console.
Untuk menjalankan BI Server, masuk ke folder biserver-ce lalu jalankan startpentaho.bat atau start-pentaho.sh dengan sebelumnya menjalankan setpentaho-env.bat atau set-pentaho-env.sh. Setelah itu, buka browser dengan alamat http://localhost:8080. Maka akan muncul halaman dari Pentaho User Console.
Lebih mudah jika kita atur konfigurasi environmentnya dengan cara klik 2x set-pentaho-env.bat
lalu untuk versi sebelumnya bisa gunakan Spoon.bat untuk menjalankan....
Spoon adalah Aplikasi GUI untuk merancang atau menjalankan job/transformation.
perbedaan antara Job dan transformation hanya pada tab design...
pada ruang kerja untuk job isi dari design adalah kumpulan job entry yang dipisahkan ke dalam beberapa group (misal group general,mail, file management, condition dst...).Sedang design pada tranformation isinya adlah kumpulan step yang juga dipisahkan ke dalam beberapa group.
Tab View berisi job entry yang saat ini digunakan oleh job yang sedang kita setting.Sedang View pada Transformation berisi step step saat ini yang sedang digunakan....
LATIHAN 1
membuat hello world
FIle-New Job ->(CTRL+ALT+N)->secara default Spoon akan menghasilkan file baru Job 1
+Pada group general->drag and drop ->job entry start
+Pada group utility ->drag and drop ->job entry Display Msgbox Info lalu klok dua kali dan kasih pesan....
+simpan lalu jalankan....
Hasilnya.....Tadaaaaaaaaaaaa
Wah mudah yaaaaaaaaa...lanjuttttttttt...:-)
REFF:
http://holowczak.com/installing-pentaho-community-edition-business-analytics-tools/4/
Pentaho oh Pentaho
Pentaho adalah kumpulan aplikasi Business Intelligence yang bersifat free open source software (FOSS) dan berjalan di atas platform Java.
Aplikasi-aplikasi Pentaho dikembangkan oleh Pentaho corp yang berpusat di Orlanda, Amerika Serikat.
Selain sifatnya gratis dan adopsi yang semakin hari semakin luas, dukungan Pentaho bisa didapatkan dari Pentaho corp dalam bentuk Service Level Agreement (SLA) dan dipaketkan dalam versi Enterprise Edition yang sifatnya annual subscription atau perlu kontrak tahunan. Selain itu jika Anda tetap menggunakan community edition yang gratis, maka bisa mendapatkan support dari banyak system integrator Pentaho di seluruh dunia termasuk komunitas d form-forum....
Apa saja kumpulan aplikasi Pentaho ?
Pentaho sebenarnya merupakan kumpulan aplikasi yang terdiri sebagai berikut :
1. Pentaho Reporting
- Merupakan aplikasi perancangan Ad Hoc Report di Pentaho.
- Engine reporting yang bisa di-embed di aplikasi Java.
- Multi Platform.
- Dapat mengambil source dari berbagai relational engine. Lihat link berikut untuk database relasional yang didukung oleh Pentaho Reporting.
- Dapat mengambil source OLAP yang didukung driver OLAP4J seperti Mondrian, SQL Server Analysis Service, PALO Molap, SAP BW, dan lainnya.
- Memiliki kemampuan mengambil source Pentaho Data Integration step. Ini menjadikan source yang dapat diambil hampir menjadi tidak terbatas.
- Dilengkapi designer yang intuitif dan koleksi chart yang lengkap untuk keperluan analisa.
- Output dalam format Format PDF, Excel, HTML dan CSV.
2. Pentaho Analysis / Mondrian OLAP Server
- OLAP server open source terpopuler dan digunakan di berbagai produk BI open source (Pentaho dan Jasper).
- Multi Platform.
- Mondrian merupakan tipe ROLAP (Relational OLAP) dimana semua perintah data query diterjemahkan via SQL dan ditujukan kepada datamart.
- Mendukung datamart dengan rancangan multi dimensional Star Schema maupun Snowflake Schema.
- Mendukung query MDX (Multidimensional Expression) sebagai standar industri.
- Didukung oleh beberapa aplikasi interface baik web based maupun desktop seperti JPivot, Pentaho Reporting, Pentaho Analysis Tools, dan Pentaho Analyzer.
- Semua interface di atas memiliki kemampuan drill down / roll up serta drill through untuk melihat detil penyusun sel-sel nilai analisis.
3. Pentaho Data Integration / Kettle
- Utilitas ETL (Extract, Transform and Load) open source paling populer.
- Designer GUI yang intuitif dan sangat mudah digunakan.
- Multi Platform.
- Script ETL dapat disimpan dalam bentuk filesystem maupun repository.
- Mendukung multi pipelining sehingga load balance maupun optimasi pekerjaan data warehouse dapat dilakukan dengan mudah.
- Mendukung clustering (master-slave) engine ETL
- Terdiri atas lebih dari 200 steps yang mencakup job (workflow kontrol) dan transformation (data worfklow).
- Mendukung Apache Virtual Filesystem (Apache VFS) sehingga filesystem seperti HTTP Webdav, FTP, SFTP, dan lain sebagainya dapat dengan mudah diakses dengan konfigurasi yang minimal.
4. Pentaho Data Mining / Weka
- Utilitas data mining yang sangat populer dan digunakan untuk predictive analysis
- Multi Platform.
- Mendukung data sumber / source berformat ARFF (Attribute-Relation File Format), XRRF (XML attribute Relation File Format), CSV (Comma Separated Value), maupun table / view dari relasional database.
- Mendukung standar PMML (Predictive Model Markup Language).
- Mendukung data nominal dan numerik (continue maupun discrete).
- Mendukung algoritma yang cukup banyak untuk operasi dasar data mining seperti Classification, Clustering dan Association. Algoritma tersebut diantaranya adalah J48, M5P, SimpleCart, SimpleKMeans, Apriori, dsbnya.
- Utilitas grafis yang membantu pengolahan dan pemahaman data mulai dari preprocessing, data visualization dalam bentuk plot maupun curve, tree visualization, dsbnya.
5. Pentaho BI Server / Platform
- Server BI yang berjalan sebagai web application portal yang terdiri dari layanan web service, workflow pada space JVM (Java Virtual Machine), dan sebagai user interface untuk laporan operasional maupun analisis.
- Multi Platform.
- Workflow berupa integrasi dari produk Pentaho yang telah disebutkan sebelumnya (Pentaho Data Integration, Pentaho Reporting, dan Pentaho Analysis) dalam bentuk solution.
- Scheduler berjalan di atas platform BI ini untuk melakukan proses batching, misalkan mengirim laporan dalam bentuk PDF ataupun Excel secara periodik.
- Script JSP (Java Server Pages) dapat dengan mudah diintegrasikan ke dalam platform.
- User dapat memiliki space sendiri untuk menyimpan report dan tipe solution lainnya.
- Ad hoc report yang bisa digunakan untuk membuat rancangan report on the fly tanpa keterlibatan IT.
Download Tutorial
Reff:
http://www.lp2maray.com
http://nurichsan.blog.unsoed.ac.id/2010/11/20/apa-itu-pentaho/
Langganan:
Postingan (Atom)





































