Meningkatkan Performa Fuzzy Clustering dengan Principal Component Analysis
DOI:
https://doi.org/10.21831/pspmm.v2i0.103Abstract
Big data adalah data yang memiliki volume yang besar, jenis data yang beragam serta produksi data yang sangat cepat. Berbagai metode matematika dan statistika dikembangkan untuk menganalisis big data ini. Jumlah data yang begitu besar dan kompleks menjadi salah satu tantangan dalam analisis big data ini. Reduksi dimensi adalah pengurangan dimensi suatu dataset dengan pertimbangan bahwa informasi-informasi penting tetap dipertahankan. Reduksi dimensi dapat digunakan untuk penyederhanaan komputasi dan visualisasi big data . Dengan dimensi yang lebih rendah hasil analisis pada data hasil reduksi masih menghasilkan kesimpulan yang relevan. Metode yang popular digunakan untuk reduksi dimensi adalah PCA. PCA adalah metode reduksi dimensi didasarkan pada komponen utama yang diperoleh dari kombinasi linear data dengan vector eigen matriks covarian terbaiknya. Penerapan PCA pada klasterisasi Fuzzy C-Means terbukti menurunkan nilai fungsi objektif hingga tersisa 0.092903%, waktu komputasi yang tersisa sebesar 63.09063%. Di saat yang sama, kualitas klaster yang dihasilkan masih bisa dipertahankan dengan nilai di atas 90%.