Misc

Gudang Data di Era Big Data: Masihkah Relevan?

Gudang data (data warehousing) adalah topik yang hangat beberapa tahun silam. Perusahaan-perusahaan yang bersinggungan dengan proses analitik dalam skala besar tentu telah akrab dengan konsep ini. Data dari berbagai sumber dalam perusahaan dibersihkan dan disatukan dalam sebuah ‘gudang’ untuk kemudian dapat dipergunakan oleh karyawan yang membutuhkan. Akronim ETL (extract, transform, load) merasuk dalam kurikulum dan muncul dalam semua buku teks berkaitan intelijen bisnis.

Namun kini, tren telah sedikit bergeser. Era big data yang mengedepankan kemampuan pemrosesan data terkini secara langsung (real time) mungkin membuat sebagian pelajar dan praktisi berpikir bahwa penyimpanan data tak lagi relevan. Buat apa repot-repot menghabiskan sumberdaya untuk data yang bisa dipanggil secara streaming real time? Benarkah?

Menilik studi kasus di perusahaan-perusahaan, seperti yang banyak dipaparkan dalam buku Carl Andersen “Creating A Data-Driven Company”, perusahaan masih membutuhkan gudang data hingga saat ini. Justru, era big data meningkatkan potensi penggunaan gudang data.

Meskipun analisis langsung memungkinkan analis mendapatkan jenis-jenis informasi tertentu, selalu ada kebutuhan akan data bersih terkontrol sebagai rujukan. Selain itu, pemrosesan data secara langsung cenderung membebani sistem dan tidak efisien untuk akses data rutin yang tidak membutuhkan data terbaru (misalnya pembuatan laporan bulanan). Gudang data pun menjadi sumber berharga untuk proses-proses pembelajaran mesin ala era big data.

Pembelajaran mesin hampir selalu membutuhkan data dalam jumlah besar. Pun, algoritma seperti ini biasanya cukup sensitif dengan kualitas data. Karena itu, gudang data yang terkurasi dengan baik akan memberikan hasil yang lebih memuaskan sebagai sumber data latih. Agar potensi ini dapat digunakan dengan baik, jelaslah bahwa pembuatan gudang data pun tidak sembarangan, dan pembersihan data bukanlah tahap yang bisa dianggap remeh.

Seperti juga banyak contoh lain dalam dunia sains dan teknologi, munculnya teknologi-teknologi baru tidak akan serta-merta menyingkirkan konsep yang telah ada. Pelajar dan praktisi hendaknya tidak selalu latah dengan tren dan selalu menganggap yang baru lebih baik, namun dapat menganalisa bagaimana semua metode dan konsep yang telah diketahui dapat berdiri berdampingan untuk membangun hasil yang maksimal demi mencapai tujuan proses bisnis.

Leave a Reply

Your email address will not be published. Required fields are marked *