Big Data adalah istilah umum yang mengacu pada data yang berukuran sangat besar dan komplek sehingga penyimpanan dan pengolahannya dengan aplikasi database tradisional sudah tidak lagi memadai. Pengolahan dengan aplikasi database tradisional ini misalnya adalah pengolahan menggunakan database MySQL, MsSQL dan sejenisnya 1).
Karena Big Data sering diperbincangkan dengan topic yang luas, seringkali terjadi kesalahan interpretasi mengenai Big Data itu sendiri. Selain itu istilah-istilah "buzzword" dalam artikel-artikel tentang Big Data menambah kebingungan lebih lanjut. Misalnya berita "Big oil turns to big data as oil prices plummet" atau "The Impacts Of Big Data That You May Not Have Heard Of" seolah-olah menyimpulkan Big Data bisa melakukan apa saja dan kalau perusahaan Anda mengimplementasikannya atau perusahaan Anda akan bisa sama berhasilnya dengan perusahaan-perusahaaan di dalam artikel tersebut. Sebenarnya tidak sesederhana itu. Untuk lebih mudahnya kita dapat membagi Big Data ke dalam beberapa topik berikut:
- Big Data Technology
- Dalam hal ini teknologi dari Big Data tersebut. Hal terpenting disini adalah pemahaman perbedaan Big Data dengan Database Traditional (DWH: Data Warehouse), kelebihan dan kekurangan masing-masing. Dalam big data technology kita berbicara mengenai hardware dan software yang bisa digunakan untuk menyimpan, mengolah, dan menganalysis data. Teknik yang populer sekarang adalah penyimpanan berbasis Hadoop dan komputasi menggunakan Map Reduce (Yarn).
- Big Data Science (and Analytics)
- Apabila perusahaan menggunakan Big Data untuk melakukan fungsi-fungsi yang selama ini dilakukan oleh DWH (dan ETL Platform), Big Data dalam hal ini tak lebih sebagai pengganti atau pelengkap DWH itu sendiri. Big Data Science berbicara mengenai algoritma yang digunakan untuk memecahkan masalah tertentu, misalnya menentukan apakah nama Anto Febrianto adalah nama seorang laki-laki atau perempuan? Menggunakan teknik klasifikasi seperti naive bayes, hal tersebut dapat dipecahkan dengan mudah.
- Big Data Cases
- Misalnya one on one campaign oleh Bank ke nasabahnya melalui email, sms, dan sosial media. Bank mengirimkan promosi belanja tertentu berdasarkan profile nasabah yang terdapat di Bank digabungkan dengan data pada Twitter atau Facebook mereka. Terlihat disini Big Data Case meliputi pemilihan teknologi dan pemilihan algoritma yang sesuai. Pada Big Data Case kita bicara mengenai implementasi big data secara real dilapangan
- Big Data Visualization
- Data mesti dapat diolah dan ditampilkan secara intuitive. Disini terdapat peran aplikasi yang bisa mengexplore Big Data agar didapatkan kesimpulan yang berguna. Beberapa teknik visualisasi yang digunakan misalnya network analysis friendship di facebook untuk melihat siapa yang paling berpengaruh dalam group.
1) Perusahaan - perusahaan database traditional ada juga yang memilki product Big Data versi mereka sendiri