- Untuk apa analisis komponen utama PCA digunakan?
- Apa keterbatasan analisis komponen utama?
- Jenis data apa adalah analisis komponen utama PCA yang paling baik digunakan?
- Kapan Anda harus menggunakan analisis komponen utama?
Untuk apa analisis komponen utama PCA digunakan?
PCA adalah alat untuk mengidentifikasi sumbu utama varian dalam set data dan memungkinkan eksplorasi data yang mudah untuk memahami variabel kunci dalam data dan outlier spot. Diterapkan dengan benar, ini adalah salah satu alat paling kuat dalam kit alat analisis data.
Apa keterbatasan analisis komponen utama?
Interpretabilitas rendah komponen utama.
Komponen utama adalah kombinasi linier dari fitur -fitur dari data asli, tetapi tidak mudah untuk ditafsirkan. Misalnya, sulit untuk mengetahui fitur mana yang paling penting dalam dataset setelah komponen utama komponen.
Jenis data apa adalah analisis komponen utama PCA yang paling baik digunakan?
PCA bekerja paling baik pada set data yang memiliki 3 atau lebih tinggi dimensi. Karena, dengan dimensi yang lebih tinggi, menjadi semakin sulit untuk membuat interpretasi dari awan data yang dihasilkan. PCA diterapkan pada set data dengan variabel numerik. PCA adalah alat yang membantu menghasilkan visualisasi data dimensi tinggi yang lebih baik.
Kapan Anda harus menggunakan analisis komponen utama?
PCA harus digunakan terutama untuk variabel yang sangat berkorelasi. Jika hubungannya lemah antara variabel, PCA tidak bekerja dengan baik untuk mengurangi data. Merujuk ke matriks korelasi untuk menentukan. Secara umum, jika sebagian besar koefisien korelasi lebih kecil dari 0.3, PCA tidak akan membantu.