Exploratory Data Analysis (EDA) adalah teknik analisa penting untuk dipahami bagi siapa saja yang bekerja dengan data. EDA merupakan proses awal untuk mengamati pola dan karakteristik penting dari suatu kumpulan data . Dengan EDA, kita bisa mengulik informasi yang tersimpan di dalam data, sebelum kita masuk ke tahap analisa yang lebih lanjut.
Mengapa EDA Penting?
EDA memiliki beberapa peran penting dalam proses analisa data, diantaranya:
- Membangun Pemahaman: EDA membantu kita untuk memahami isi dari data yang kita miliki. Kita bisa mengetahui gambaran umum mengenai data, seperti distribusi data, nilai minimum dan maksimum, serta ada tidaknya anomali.
- Menemukan Pola: Dengan EDA, kita bisa menemukan pola-pola menarik yang tersembunyi di dalam data. Pola-pola ini bisa membantu kita dalam proses pengambilan keputusan dan menjawab pertanyaan penelitian.
- Persiapan Analisa Lanjutan: EDA menjadi tahap awal yang penting sebelum kita melakukan analisa data yang lebih lanjut, seperti pemodelan atau uji hipotesis. EDA membantu kita untuk memilih teknik analisa yang tepat dan sesuai dengan karakteristik data.
Pelaksanaan EDA
EDA biasanya dilakukan dengan menggunakan kombinasi antara metode statistik dan visualisasi data. Beberapa langkah umum dalam pelaksanaan EDA meliputi:
- Deskripsi Statistik: Kita bisa menghitung ukuran tendensi sentral (mean, median) dan dispersi (standar deviasi) untuk memahami distribusi data secara umum.
- Visualisasi Data: Kita bisa menggunakan grafik seperti histogram, boxplot, scatter plot, dan lain sebagainya untuk melihat distribusi data, hubungan antar variabel, dan keberadaan anomali.
- Pemeriksaan Anomali: EDA membantu kita untuk menemukan nilai-nilai yang tidak biasa (anomali) di dalam data. Anomali ini perlu diinvestigasi lebih lanjut untuk mengetahui penyebabnya
Kesimpulan
Singkatnya, EDA adalah proses investigasi awal untuk memahami karakteristik dari suatu kumpulan data. Dengan EDA, kita bisa menemukan pola dan informasi penting yang tersimpan di dalam data. EDA merupakan langkah awal yang krusial sebelum kita berlanjut ke tahap analisa data yang lebih lanjut.
