Apa masalah ketidakseimbangan kelas? Ini adalah masalah dalam pembelajaran mesin di mana jumlah total kelas data (positif) jauh lebih sedikit dari jumlah total kelas data lain (negatif).
- Apa artinya dengan masalah ketidakseimbangan kelas?
- Apa contoh ketidakseimbangan kelas?
- Apa ketidakseimbangan kelas dan bagaimana Anda menghadapinya?
- Apa masalah ketidakseimbangan kelas dan mengapa itu merupakan tantangan untuk prediksi?
Apa artinya dengan masalah ketidakseimbangan kelas?
Masalah ketidakseimbangan kelas biasanya terjadi ketika ada lebih banyak contoh beberapa kelas daripada yang lain. Dalam kasus seperti itu, pengklasifikasi standar cenderung kewalahan oleh kelas besar dan mengabaikan yang kecil.
Apa contoh ketidakseimbangan kelas?
Ketidakseimbangan kelas adalah normal dan diharapkan dalam aplikasi ML khas. Misalnya: dalam deteksi penipuan kartu kredit, sebagian besar transaksi adalah sah, dan hanya sebagian kecil yang curang. Dalam deteksi spam, sebaliknya: sebagian besar email yang dikirim ke seluruh dunia hari ini adalah spam.
Apa ketidakseimbangan kelas dan bagaimana Anda menghadapinya?
Salah satu teknik ketidakseimbangan kelas yang diadopsi secara luas untuk berurusan dengan set data yang sangat tidak seimbang disebut resampling. Ini terdiri dari menghapus sampel dari kelas mayoritas (kurang sampel) dan/atau menambahkan lebih banyak contoh dari kelas minoritas (over-sampling).
Apa masalah ketidakseimbangan kelas dan mengapa itu merupakan tantangan untuk prediksi?
Klasifikasi yang tidak seimbang secara khusus sulit karena distribusi kelas yang sangat miring dan biaya kesalahan klasifikasi yang tidak setara. Kesulitan klasifikasi yang tidak seimbang diperparah oleh properti seperti ukuran dataset, noise label, dan distribusi data.