- Apa yang oversampling dalam python?
- Bagaimana Anda Oversample Data?
- Bagaimana Anda meningkatkan data dalam Python?
Apa yang oversampling dalam python?
Oversampling acak melibatkan memilih secara acak dari kelas minoritas, dengan penggantian, dan menambahkannya ke setelun pelatihan. Undersampling acak melibatkan memilih secara acak contoh dari kelas mayoritas dan menghapusnya dari dataset pelatihan.
Bagaimana Anda Oversample Data?
Untuk kemudian oversample, ambil sampel dari dataset, dan pertimbangkan tet tetangga terdekatnya (dalam ruang fitur). Untuk membuat titik data sintetis, ambil vektor antara salah satu tetangga K, dan titik data saat ini. Lipat gandakan vektor ini dengan angka acak x yang terletak di antara 0, dan 1.
Bagaimana Anda meningkatkan data dalam Python?
Anda dapat meningkatkan dataset dengan hanya menyalin catatan dari kelas minoritas. Anda dapat melakukannya melalui metode resample () dari sklearn. memanfaatkan modul, seperti yang ditunjukkan dalam skrip berikut. Anda dapat melihat bahwa dalam hal ini, argumen pertama yang kami lewati metode resample () adalah kelas minoritas kami, saya.e. Dataset spam kami.