Meningkatkan Performa Fuzzy Clustering dengan Principal Component Analysis

Joko Eliyanto, Sugiyarto Sugiyarto

Abstract


Big data adalah data yang memiliki volume yang besar, jenis data yang beragam serta produksi data yang sangat cepat. Berbagai metode matematika dan statistika dikembangkan untuk menganalisis big data ini. Jumlah data yang begitu besar dan kompleks menjadi salah satu tantangan dalam analisis big data ini. Reduksi dimensi adalah pengurangan dimensi suatu dataset dengan pertimbangan bahwa informasi-informasi penting tetap dipertahankan. Reduksi dimensi dapat digunakan untuk penyederhanaan komputasi dan visualisasi big data . Dengan dimensi yang lebih rendah hasil analisis pada data hasil reduksi masih menghasilkan kesimpulan yang relevan. Metode yang popular digunakan untuk reduksi dimensi adalah PCA. PCA adalah metode reduksi dimensi didasarkan pada komponen utama yang diperoleh dari kombinasi linear data dengan vector eigen matriks covarian terbaiknya. Penerapan PCA pada klasterisasi Fuzzy C-Means terbukti menurunkan nilai fungsi objektif hingga tersisa 0.092903%, waktu komputasi yang tersisa sebesar 63.09063%. Di saat yang sama, kualitas klaster yang dihasilkan masih bisa dipertahankan dengan nilai di atas 90%.




DOI: https://doi.org/10.21831/pspmm.v2i0.103

Refbacks

  • There are currently no refbacks.


Copyright (c) 2020 Prosiding Seminar Pendidikan Matematika dan Matematika

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.

Creative Commons License
Prosiding Seminar Pendidikan Matematika dan Matematika is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.
Based on a work at http://prosiding.himatikauny.org/index.php/prosidinglsm.

Prosiding LSM Stats