Perbandingan Algoritma Klasifikasi KNN, Gaussian Naive Bayes, Dan Random Forest Pada Dataset LCMS Tanaman Keladi Tikus Yang Diseimbangkan Dengan Metode Synthetic Minority Over-Sampling Technique

Authors

  • Vina Meriana Jurusan Informatika, Universitas Sanata Dharma
  • Ni Komang Ayu Wirayanti Jurusan Informatika, Universitas Sanata Dharma
  • Julius Rakha Bowo Laksono Jurusan Informatika, Universitas Sanata Dharma
  • Iwan Binanto Jurusan Informatika, Universitas Sanata Dharma
  • Nesti F Sianipar Biotechnology Department, Faculty of Engineering, Bina Nusantara University

DOI:

https://doi.org/10.35842/sintaks.v2i1.27

Keywords:

Synthetic Minority Over-sampling Technique, Klasifikasi, Imbalance Data, Keladi Tikus

Abstract

Data yang tidak seimbang dapat mempengaruhi tingkat akurasi dalam klasifikasi, dan salah satu metode yang digunakan untuk menyeimbangkan data adalah Synthetic Minority Oversampling Technique (SMOTE), yang merupakan teknik oversampling untuk menghasilkan data sintetis dari kelas minoritas. Pada penelitian ini digunakan algoritma Random Forest, KNN, dan Gaussian Naïve Bayes untuk klasifikasi. Metode penelitian yang digunakan meliputi pengumpulan data, preprocessing data, pemrosesan ketidakseimbangan data, pembagian data menjadi subset pelatihan dan pengujian, implementasi algoritma, evaluasi kinerja menggunakan metrik evaluasi klasifikasi, analisis hasil, uji statistik, kesimpulan, dan saran. Berdasarkan eksperimen didapat hasil bahwa algoritma Random Forest merupakan algoritma yang mempunyai akurasi tertinggi dibandingkan kedua algoritma yang lain, baik tu pada data tidak seimbang maupun data yang sudah diseimbangkan dengan metode Synthetic Minority Over-sampling Technique (SMOTE)

Downloads

Published

2023-09-07