Perbandingan Model Logistic Regression dan K-Nearest Neighbour dalam Prediksi Pembatalan Hotel

Mohammad Fahry Sholahuddin, Abdul Holik, Chelvin Suprapto, Iqbal Izha Mahendra, Sadewa Wibawanto, Muchamad Kurniawan

Abstract


Dari beberapa penelitian sebelumnya mengenai metode KNN dan Regresi Logistik yang telah dilakukan beberapa peneliti mengenai metode KNN dan Regresi Logistik, penelitian kali ini dilaksanakan untuk membandingkan metode supervised learning antara metode KNN dan Regresi Logistik. Adapun tujuan penelitian ini adalah mencari tahu manakah diantara kedua metode tersebut mempunyai nilai akurasi, presisi, recall yang paling baik dalam memprediksikan pembatalan hotel. K-Nearest Neighbor (K-NN) tergolong pada kelompok instance-based learning. Metode ini merupakan salah satu teknik lazy learning. K-NN bekerja dengan cara melakukan pencarian terhadap kelompok k objek dalam data latih yang paling dekat (mirip) terhadap objek pada data baru atau data uji. Sebuah sistem pengklasifikasian sangat dibutuhkan sebagai sebuah sistem yang dapat mencari sebuah informasi [1]. Regresi Logistik merupakan salah satu metode pengklasifikasian dalam statistical machine learning, dan termasuk pula kedalam metode supervised learning. Pada dasarnya metode ini memiliki performa yang baik dalam menangani data berskala besar dan merupakan salah satu metode yang paling sering digunakan dalam data mining [2]. Dari proses K-Fold Cross Validation metode K-Nearest Neighbour didapat nilai Accuracy tertinggi dengan 0.81, Precission sebesar 0.81 Serta Recall sebesar 0.80. Sedangakan proses K-Fold Cross Validation metode Logistic Regression didapat nilai Accuracy tertinggi dengan 0.80, Precission sebesar 0.80 Serta Recall sebesar 0.80. Dari kedua hasil evaluasi melalui K-Fold Cross Validation yang telah dilakukan pada metode K-Nearest Neighbour dan Logistic Regression. Didapakan hasil bahwa metode K-Nearest Neighbour mempunyai nilai Accuracy, Precission serta Recall tertinggi dalam proses prediksi pembatalan hotel diabandingkan dengan Logistic Regression. Dimana didapat nilai tertinggi dari proses K-Fold Cross Validation dengan Accuracy sebesar 0.81, Precission sebesar 0.81 serta Recall sebesar 0.80.


Keywords


Accuracy; K-Nearest Neighbor (K-NN); Logistic Regression; Pembatalan hotel; Supervised learning;

Full Text:

PDF

References


D. Cahyanti, A. Rahmayani, dan S. A. Husniar, “Analisis performa metode Knn pada Dataset pasien pengidap Kanker Payudara,” Indones. J. Data Sci., vol. 1, no. 2, hal. 39–43, 2020, doi: 10.33096/ijodas.v1i2.13.

Z. Yang, “Application of Logistic Regression with Filter in Data Classification,” hal. 3755–3759, 2019, doi: 10.23919/ChiCC.2019.8865281.

Y. I. Kurniawan dan T. I. Barokah, “Klasifikasi Penentuan Pengajuan Kartu Kredit Menggunakan K-Nearest Neighbor,” J. Ilm. Matrik, vol. 22, no. 1, hal. 73–82, 2020, doi: 10.33557/jurnalmatrik.v22i1.843.

M. S. T. Putra dan Y. Azhar, “Perbandingan Model Logistic Regression dan Artificial Neural Network pada Prediksi Pembatalan Hotel,” JISKA (Jurnal Inform. Sunan Kalijaga), vol. 6, no. 1, hal. 29–37, 2021, doi: 10.14421/jiska.2021.61-04.

N. Antonio, A. de Almeida, dan L. Nunes, “Hotel booking demand datasets,” Data Br., vol. 22, hal. 41–49, 2019, doi: 10.1016/j.dib.2018.11.126.

X. Zou, Y. Hu, Z. Tian, dan K. Shen, “Logistic Regression Model Optimization and Case Analysis,” Proc. IEEE 7th Int. Conf. Comput. Sci. Netw. Technol. ICCSNT 2019, hal. 135–139, 2019, doi: 10.1109/ICCSNT47585.2019.8962457.

R. Strandberg dan J. Låås, “A comparison between Neural networks, Lasso regularized Logistic regression, and Gradient boosted trees in modeling binary sales,” 2019, [Daring]. Tersedia pada: https://www.diva-portal.org/smash/get/diva2:1319871/FULLTEXT02




DOI: https://doi.org/10.31284/p.snestik.2023.4040

Refbacks

  • There are currently no refbacks.


Copyright (c) 2023 Mohammad Fahry Sholahuddin, Abdul Holik, Chelvin Suprapto, Iqbal Izha Mahendra, Sadewa Wibawanto, Muchamad Kurniawan

Creative Commons License
This work is licensed under a Creative Commons Attribution-ShareAlike 4.0 International License.