Optimisasi Klasifikasi Sentimen Pada Review Hotel Bahasa Inggris Dengan Model Roberta Twitter
DOI:
https://doi.org/10.31598/sintechjournal.v7i2.1547Keywords:
BERT, roberta, hotel, sentimenAbstract
Dalam era digital, wisatawan sering menggunakan internet untuk mencari dan memesan hotel. Ulasan hotel online adalah sumber informasi penting bagi calon tamu, namun sentimen dalam ulasan ini sulit diinterpretasikan karena bahasa yang kompleks dan kontekstual. Klasifikasi sentimen yang akurat dalam ulasan hotel berbahasa Inggris memerlukan strategi yang canggih. Penelitian ini fokus pada model RoBERTa Twitter, yang merupakan pengembangan dari BERT (BiDirectional Encoder Representations from Transformers) Google, untuk meningkatkan pemahaman bahasa dan kinerja dalam konteks ulasan hotel. Dengan pendekatan pelatihan yang lebih komprehensif, model ini diharapkan dapat meningkatkan akurasi analisis sentimen. Penelitian ini melibatkan tahapan identifikasi masalah, seleksi data, preprocessing, pemodelan, dan pengujian hyperparameter. Hasil evaluasi menunjukkan kinerja model yang memuaskan dengan akurasi sentimen 88%, namun akurasi untuk aspek tertentu lebih rendah, dengan fasilitas 75%, pelayanan 78%, kamar 81%, serta lokasi dan harga 84%. Penelitian ini bertujuan untuk memberikan kontribusi dalam meningkatkan akurasi analisis sentimen, mendukung keputusan yang lebih tepat dalam pemilihan hotel online.
Downloads
References
J. Devlin, M.-W. Chang, K. Lee, K. T. Google, and A. I. Language, “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,” Naacl-Hlt 2019, no. Mlm, pp. 4171–4186, 2019.
N. P. A. Dewi, N. A. Sanjaya ER, A. E. Karyawati, I. B. M. Mahendra, I. B. G. Dwidasmara, and I. G. A. Wibawa, “Analisis Sentimen Berbasis Aspek Ulasan Pelanggan Hotel di Bali Menggunakan Metode Decision Tree,” JELIKU (Jurnal Elektron. Ilmu Komput. Udayana), vol. 11, no. 3, p. 625, 2022, doi: 10.24843/jlk.2023.v11.i03.p19.
C. H. Lin and U. Nuha, “Sentiment analysis of Indonesian datasets based on a hybrid deep-learning strategy,” J. Big Data, vol. 10, no. 1, 2023, doi: 10.1186/s40537-023-00782-9.
V. Chandradev, I. M. Agus, D. Suarjaya, and I. P. A. Bayupati, “Analisis Sentimen Review Hotel Menggunakan Metode Deep Learning BERT,” pp. 107–116, 2022.
M. D. MAHENDA, “Analisis Sentimen Berdasarkan Aspek Pada Ulasan Hotel Berbahasa Indonesia,” pp. 78–79, 2020, [Online]. Available: https://etd.repository.ugm.ac.id/penelitian/detail/191509
M. O. Shintapuri, “Penerapan Text Mining Dan Analisis Sentimen Untuk Rekomendasi Hotel Berdasarkan Online Review,” 2020, [Online]. Available: http://e-journal.uajy.ac.id/id/eprint/22739
M. Priandi, “Analisis Sentimen Masyarakat Terhadap Pembelajaran Daring di Era Pandemi Covid-19 pada Media Sosial Twitter Menggunakan Ekstraksi Fitur Countvectorizer dan Algoritma K-Nearest Neighbor,” no. September, pp. 311–319, 2021.
H. Utami, “Analisis Sentimen dari Aplikasi Shopee Indonesia Menggunakan Metode Recurrent Neural Network,” Indones. J. Appl. Stat., vol. 5, no. 1, p. 31, 2022, doi: 10.13057/ijas.v5i1.56825.
E. Budianita, E. P. Cynthia, A. Pranata, and D. Abimanyu, “Pendekatan berbasis Machine Learning dan Leksikal Pada Analisis Sentimen,” Semin. Nas. Teknol. Informasi, Komun. dan Ind., pp. 99–104, 2022, [Online]. Available: https://ejournal.uin-suska.ac.id/index.php/SNTIKI/article/view/19137
N. E. Oktaviana, Y. A. Sari, and I. Indriati, “Analisis Sentimen terhadap Kebijakan Kuliah Daring Selama Pandemi Menggunakan Pendekatan Lexicon Based Features dan Support Vector Machine,” J. Teknol. Inf. dan Ilmu Komput., vol. 9, no. 2, pp. 357–362, 2022, doi: 10.25126/jtiik.2022925625.
A. Vaswani et al., “Attention is all you need,” Adv. Neural Inf. Process. Syst., vol. 2017-Decem, no. Nips, pp. 5999–6009, 2017.
Y. Liu et al., “RoBERTa: A Robustly Optimized BERT Pretraining Approach,” no. 1, 2019, [Online]. Available: http://arxiv.org/abs/1907.11692
L. H. P. de Chavannes, M. Kongsbak, T. M. R. Lagermann, and L. Derczynski, “Hyperparameter Power Impact in Transformer Language Model Training,” Sustain. 2021 - 2nd Work. Simple Effic. Nat. Lang. Process. Proc. Sustain., pp. 96–118, 2021, doi: 10.18653/v1/2021.sustainlp-1.12.
M. H. Chyntia, D. E. Ratnawati, and I. Arwani, “Analisis Sentimen berbasis Aspek terhadap Ulasan Hotel Tentrem Yogyakarta menggunakan Algoritma Random Forest Classifier,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 6, no. 4, pp. 1702–1708, 2022, [Online]. Available: http://j-ptiik.ub.ac.id
V. A. Flores, P. A. Permatasari, and L. Jasa, “Penerapan Web Scraping Sebagai Media Pencarian dan Menyimpan Artikel Ilmiah Secara Otomatis Berdasarkan Keyword,” Maj. Ilm. Teknol. Elektro, vol. 19, no. 2, p. 157, 2020, doi: 10.24843/mite.2020.v19i02.p06.
A. P. Putra, A. N. Alivia, M. Meilani, N. J. Azzahra, and N. A. Rakhmawati, “Analisis Sentimen Warga Twitter Terhadap Game Shopee Cocoki Dengan Metode Naive Bayes Classifier,” J. Ilm. Inform. Komput., vol. 28, no. 2, pp. 137–148, 2023, doi: 10.35760/ik.2023.v28i2.9494.
S. T. Sipil, F. Teknik, U. Sebelas, and M. Surakarta, “Dan Penurunan Fondasi Tiang Menggunakan Correlation Based Feature Selection ( Cfs ),” vol. 11, no. 3, pp. 237–244, 2023.
B. Hakim, “Analisa Sentimen Data Text Preprocessing Pada Data Mining Dengan Menggunakan Machine Learning,” JBASE - J. Bus. Audit Inf. Syst., vol. 4, no. 2, pp. 16–22, 2021, doi: 10.30813/jbase.v4i2.3000.
H. Najjichah, A. Sukur, and H. Subagyo, “Pengaruh Text Preprocessing dan Kombinasinya,” J. Teknol. Inf., vol. 15, no. 1, pp. 1–11, 2019.
T. A. E. Putri, T. Widiharih, and R. Santoso, “Penerapan Tuning Hyperparameter Randomsearchcv Pada Adaptive Boosting Untuk Prediksi Kelangsungan Hidup Pasien Gagal Jantung,” J. Gaussian, vol. 11, no. 3, pp. 397–406, 2023, doi: 10.14710/j.gauss.11.3.397-406.
N. Khamidah, K. Sadik, A. M. Soleh, and G. A. Dito, “Regularisasi model pembelajaran mesin dengan regresi terpenalti pada data yang mengandung multikolinearitas ( Studi kasus prediksi Indeks Pembangunan Manusia di 34 provinsi di Indonesia ),” vol. 24, no. 1, pp. 12–26, 2024.
W. Astriningsih and D. Hatta Fudholi, “Identifikasi Multi Aspek Dan Sentimen Analisis Pada Review Hotel Menggunakan Deep Learning,” J. Tek. Inform. dan Sist. Inf., vol. 10, no. 3, p. 433, 2023, [Online]. Available: http://jurnal.mdp.ac.id
Downloads
Published
Issue
Section
License
Copyright (c) 2024 Bagas Setiadi, Eko Purwanto, Hanifah Permatasari
This work is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 4.0 International License.
Copyright in each article belongs to the author.
- The authors admit that SINTECH Journal as a publisher who published the first time under Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) License.
- Authors can include writing separately, regulate distribution of non-ekskulif of manuscripts that have been published in this journal into another version (eg sent to respository institution author, publication into a book, etc.), by recognizing that the manuscripts have been published for the first time in SINTECH Journal