Jika Anda skala sebelum PCA?
PCA dipengaruhi oleh skala, jadi Anda perlu skala fitur dalam data Anda sebelum menerapkan PCA. Gunakan StandardsCaler dari Scikit Learn untuk menstandarkan fitur dataset ke skala unit (rata -rata = 0 dan standar deviasi = 1) yang merupakan persyaratan untuk kinerja optimal dari banyak algoritma pembelajaran mesin.
Mengapa penskalaan diperlukan untuk PCA?
Saat berhadapan dengan data yang memiliki fitur dengan skala yang berbeda, seringkali penting untuk skala data terlebih dahulu. Ini karena data yang memiliki nilai lebih besar dapat mempengaruhi data bahkan dengan variabilitas yang relatif sedikit. Bingkai data gabungan dimuat untuk Anda.