#bigdata, apalah artinya data segudang kalo ga bisa dijelaskan secara visual :) Kali ini saya akan mencoba untuk membuat Dashboard visualisasi data dari Cloudera Big Data Server menggunakan Tableau.
Instalasi Cloudera dan Tableau
Sebelum memulai, pastikan anda telah menjalankan Cloudera, lihat tulisan saya sebelumnya. Kemudian install Tableau, saya menggunakan versi trial 14 hari Tableau Desktop.
Agar Tableau dapat mengakses #bigdata dari Cloudera kita membutuhkan ODBC Driver. Ada 2 driver yang disediakan yaitu Hive & Impala ODBC Driver. Hive digunakan untuk parralel proses batch query dan Impala digunakan untuk proses interaktif query yang membutuhkan respon yang cepat. Maka, kali ini kita membutuhkan Impala ODBC Driver.
Persiapan Dataset
Dataset yang akan digunakan adalah superstore yang disediakan oleh Tableau. Sebelumnya data superstore harus diimport terlebih dahulu ke Cloudera. Impala hanya dapat mengimport data berbentuk text delimited, dan saya telah siapkan file dataset superstore yang telah diubah dari excel ke text file disini.
Import Dataset
Jalankan cloudera, lalu buka hue. Untuk mengimport dataset buka menu Metastore Tables lalu klik tombol create new table from file
Pada table name isi dengan superstore, lalu pada input file upload superstore.txt yang saya berikan, setelah itu next next.
Selanjutnya coba test apakah dataset tersebut sudah berhasil diimport, dengan cara masuk ke menu Query Editors -> Impala
Lalu jalankan query select count, harusnya menghasilkan nilai seperti dibawah ini.
Koneksi Tableau dengan Cloudera Impala
Buka Tableau Desktop dan buat koneksi ke Cloudera server.
Server name : localhost
Port : 21050
Type : Impala
Authentication : No Authentication
Setelah berhasil connect ke Impala Cloudera, pilih schema default dan table superstore drag ke area datasource.
Dashboard
Untuk pembuatan dashboard, pindah ke worksheet dan buat analisa dengan memilih dimention dan measure yang dinginkan.
Saya sertakan sample workbook Dashboard Tableau yang dapat digunakan sebagai referensi untuk membuat visualisasi dashboard #bigdata dari Cloudera menggunakan Tableau.