Optimisasi Klasifikasi Sentimen Pada Review Hotel Bahasa Inggris Dengan Model Roberta Twitter

Authors

  • Bagas Setiadi Universitas Duta Bangsa Surakarta
  • Eko Purwanto Universitas Duta Bangsa Surakarta
  • Hanifah Permatasari Universitas Duta Bangsa Surakarta

DOI:

https://doi.org/10.31598/sintechjournal.v7i2.1547

Keywords:

BERT, roberta, hotel, sentimen

Abstract

Dalam era digital, wisatawan sering menggunakan internet untuk mencari dan memesan hotel. Ulasan hotel online adalah sumber informasi penting bagi calon tamu, namun sentimen dalam ulasan ini sulit diinterpretasikan karena bahasa yang kompleks dan kontekstual. Klasifikasi sentimen yang akurat dalam ulasan hotel berbahasa Inggris memerlukan strategi yang canggih. Penelitian ini fokus pada model RoBERTa Twitter, yang merupakan pengembangan dari BERT (BiDirectional Encoder Representations from Transformers) Google, untuk meningkatkan pemahaman bahasa dan kinerja dalam konteks ulasan hotel. Dengan pendekatan pelatihan yang lebih komprehensif, model ini diharapkan dapat meningkatkan akurasi analisis sentimen. Penelitian ini melibatkan tahapan identifikasi masalah, seleksi data, preprocessing, pemodelan, dan pengujian hyperparameter. Hasil evaluasi menunjukkan kinerja model yang memuaskan dengan akurasi sentimen 88%, namun akurasi untuk aspek tertentu lebih rendah, dengan fasilitas 75%, pelayanan 78%, kamar 81%, serta lokasi dan harga 84%. Penelitian ini bertujuan untuk memberikan kontribusi dalam meningkatkan akurasi analisis sentimen, mendukung keputusan yang lebih tepat dalam pemilihan hotel online.

Downloads

Download data is not yet available.

References

J. Devlin, M.-W. Chang, K. Lee, K. T. Google, and A. I. Language, “BERT: Pre-training of Deep Bidirectional Transformers for Language Understanding,” Naacl-Hlt 2019, no. Mlm, pp. 4171–4186, 2019.

N. P. A. Dewi, N. A. Sanjaya ER, A. E. Karyawati, I. B. M. Mahendra, I. B. G. Dwidasmara, and I. G. A. Wibawa, “Analisis Sentimen Berbasis Aspek Ulasan Pelanggan Hotel di Bali Menggunakan Metode Decision Tree,” JELIKU (Jurnal Elektron. Ilmu Komput. Udayana), vol. 11, no. 3, p. 625, 2022, doi: 10.24843/jlk.2023.v11.i03.p19.

C. H. Lin and U. Nuha, “Sentiment analysis of Indonesian datasets based on a hybrid deep-learning strategy,” J. Big Data, vol. 10, no. 1, 2023, doi: 10.1186/s40537-023-00782-9.

V. Chandradev, I. M. Agus, D. Suarjaya, and I. P. A. Bayupati, “Analisis Sentimen Review Hotel Menggunakan Metode Deep Learning BERT,” pp. 107–116, 2022.

M. D. MAHENDA, “Analisis Sentimen Berdasarkan Aspek Pada Ulasan Hotel Berbahasa Indonesia,” pp. 78–79, 2020, [Online]. Available: https://etd.repository.ugm.ac.id/penelitian/detail/191509

M. O. Shintapuri, “Penerapan Text Mining Dan Analisis Sentimen Untuk Rekomendasi Hotel Berdasarkan Online Review,” 2020, [Online]. Available: http://e-journal.uajy.ac.id/id/eprint/22739

M. Priandi, “Analisis Sentimen Masyarakat Terhadap Pembelajaran Daring di Era Pandemi Covid-19 pada Media Sosial Twitter Menggunakan Ekstraksi Fitur Countvectorizer dan Algoritma K-Nearest Neighbor,” no. September, pp. 311–319, 2021.

H. Utami, “Analisis Sentimen dari Aplikasi Shopee Indonesia Menggunakan Metode Recurrent Neural Network,” Indones. J. Appl. Stat., vol. 5, no. 1, p. 31, 2022, doi: 10.13057/ijas.v5i1.56825.

E. Budianita, E. P. Cynthia, A. Pranata, and D. Abimanyu, “Pendekatan berbasis Machine Learning dan Leksikal Pada Analisis Sentimen,” Semin. Nas. Teknol. Informasi, Komun. dan Ind., pp. 99–104, 2022, [Online]. Available: https://ejournal.uin-suska.ac.id/index.php/SNTIKI/article/view/19137

N. E. Oktaviana, Y. A. Sari, and I. Indriati, “Analisis Sentimen terhadap Kebijakan Kuliah Daring Selama Pandemi Menggunakan Pendekatan Lexicon Based Features dan Support Vector Machine,” J. Teknol. Inf. dan Ilmu Komput., vol. 9, no. 2, pp. 357–362, 2022, doi: 10.25126/jtiik.2022925625.

A. Vaswani et al., “Attention is all you need,” Adv. Neural Inf. Process. Syst., vol. 2017-Decem, no. Nips, pp. 5999–6009, 2017.

Y. Liu et al., “RoBERTa: A Robustly Optimized BERT Pretraining Approach,” no. 1, 2019, [Online]. Available: http://arxiv.org/abs/1907.11692

L. H. P. de Chavannes, M. Kongsbak, T. M. R. Lagermann, and L. Derczynski, “Hyperparameter Power Impact in Transformer Language Model Training,” Sustain. 2021 - 2nd Work. Simple Effic. Nat. Lang. Process. Proc. Sustain., pp. 96–118, 2021, doi: 10.18653/v1/2021.sustainlp-1.12.

M. H. Chyntia, D. E. Ratnawati, and I. Arwani, “Analisis Sentimen berbasis Aspek terhadap Ulasan Hotel Tentrem Yogyakarta menggunakan Algoritma Random Forest Classifier,” J. Pengemb. Teknol. Inf. dan Ilmu Komput., vol. 6, no. 4, pp. 1702–1708, 2022, [Online]. Available: http://j-ptiik.ub.ac.id

V. A. Flores, P. A. Permatasari, and L. Jasa, “Penerapan Web Scraping Sebagai Media Pencarian dan Menyimpan Artikel Ilmiah Secara Otomatis Berdasarkan Keyword,” Maj. Ilm. Teknol. Elektro, vol. 19, no. 2, p. 157, 2020, doi: 10.24843/mite.2020.v19i02.p06.

A. P. Putra, A. N. Alivia, M. Meilani, N. J. Azzahra, and N. A. Rakhmawati, “Analisis Sentimen Warga Twitter Terhadap Game Shopee Cocoki Dengan Metode Naive Bayes Classifier,” J. Ilm. Inform. Komput., vol. 28, no. 2, pp. 137–148, 2023, doi: 10.35760/ik.2023.v28i2.9494.

S. T. Sipil, F. Teknik, U. Sebelas, and M. Surakarta, “Dan Penurunan Fondasi Tiang Menggunakan Correlation Based Feature Selection ( Cfs ),” vol. 11, no. 3, pp. 237–244, 2023.

B. Hakim, “Analisa Sentimen Data Text Preprocessing Pada Data Mining Dengan Menggunakan Machine Learning,” JBASE - J. Bus. Audit Inf. Syst., vol. 4, no. 2, pp. 16–22, 2021, doi: 10.30813/jbase.v4i2.3000.

H. Najjichah, A. Sukur, and H. Subagyo, “Pengaruh Text Preprocessing dan Kombinasinya,” J. Teknol. Inf., vol. 15, no. 1, pp. 1–11, 2019.

T. A. E. Putri, T. Widiharih, and R. Santoso, “Penerapan Tuning Hyperparameter Randomsearchcv Pada Adaptive Boosting Untuk Prediksi Kelangsungan Hidup Pasien Gagal Jantung,” J. Gaussian, vol. 11, no. 3, pp. 397–406, 2023, doi: 10.14710/j.gauss.11.3.397-406.

N. Khamidah, K. Sadik, A. M. Soleh, and G. A. Dito, “Regularisasi model pembelajaran mesin dengan regresi terpenalti pada data yang mengandung multikolinearitas ( Studi kasus prediksi Indeks Pembangunan Manusia di 34 provinsi di Indonesia ),” vol. 24, no. 1, pp. 12–26, 2024.

W. Astriningsih and D. Hatta Fudholi, “Identifikasi Multi Aspek Dan Sentimen Analisis Pada Review Hotel Menggunakan Deep Learning,” J. Tek. Inform. dan Sist. Inf., vol. 10, no. 3, p. 433, 2023, [Online]. Available: http://jurnal.mdp.ac.id

Downloads

Published

2024-08-31