Prediksi Kualitas Kopi Dengan Algoritma Random Forest Melalui Pendekatan Data Science
DOI:
10.47709/dsi.v2i1.1708Dimension Badge Record
Abstract
Perusahaan yang bergerak dibidang produksi kopi, selalu mementingkan kualitas kopi untuk menghasilkan produk yang dapat bersaing dengan kompetitor lainnya . Adapun sistem yang dapat dibangun untuk mengatasi permasalahan tersebut yaitu berupa prediksi dalam menentukan kualitas kopi. Data kopi yang digunakan pada penelitian ini didapatkan dari Coffee Quality Institute. Data ini memiliki 44 kolom atau variabel dengan jumlah data sebanyak 1339 data. Tahapan yang dilakukan dengan pendekatan data science dengan algoritma random forest terdiri dari proses pengumpulan data, preprocessing, pengumpulan data, split data, pemrosesan dengan algoritma Random Forest yang menghasilkan hasil prediksi, hingga yang terakhir adalah proses evaluasi performa algoritma Random Forest dalam memprediksi kualitas kopi. Variabel dependen yang diprediksi pada penelitian ini secara berurutan dari kualitas terbaik hingga terburuk antara lain adalah kualitas kopi Specialty Grade, Premium, Exchange, dan Below Standard. Kualitas kopi premium adalah hasil prediksi paling baik dengan hasil actual 135. Jumlah data yang cukup untuk memastikan algoritma random forest dapat memprediksi dengan cukup baik dengan akurasi yang mencapai 79% masih memiliki ruang untuk perkembangan sehingga bisa mendekati 100%. Kurang optimalnya nilai akurasi pada penelitian ini dapat diakibatkan oleh kurangnya variabel independen yang digunakan. Penelitian ini hanya menggunakan 8 variabel dari 43 variabel yang tersedia. Sehingga masih terdapat variabel yang berpotensi dapat meningkatkan akurasi. Tidak dilakukannya penyetelan parameter Random Forest yang tersedia untuk meningkatkan akurasi.
Google Scholar Cite Analysis
Abstract viewed = 1201 times
Abstract viewed = 1201 times
Downloads
ARTICLE Published HISTORY
Issue
Section
Articles