Komparasi algoritma naive bayes classifier dan Support Vector Machine (SVM) dalam analisis sentimen opini masyarakat terhadap polusi udara Jakarta di media sosial twitter

Azizah, Isti Nur (2024) Komparasi algoritma naive bayes classifier dan Support Vector Machine (SVM) dalam analisis sentimen opini masyarakat terhadap polusi udara Jakarta di media sosial twitter. Undergraduate (S1) thesis, Universitas Islam Negeri Walisongo Semarang.

[thumbnail of SKRIPSI_2008096041_ISTI_NUR_AZIZAH] Text (SKRIPSI_2008096041_ISTI_NUR_AZIZAH)
2008096041_ISTI NUR AZIZAH_Lengkap Tugas Akhir - ISTI NUR AZIZAH UIN Walisongo Semarang.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.

Download (7MB)

Abstract

Buruknya kualitas udara di Jakarta telah menjadi isu yang diperbincangkan sejak bulan Agustus 2023 di media sosial Twitter. Peneliti mengolah data tanggapan, opini serta keluhan pengguna Twitter terkait pro dan kontra akan polusi udara di Jakarta untuk dilakukan analisis sentimen opini masyarakat terhadap polusi udara Jakarta menggunakan dua model klasifikasi yaitu Naive Bayes Classifier dan Support Vector Machine. Tahapan awal penelitian ini dengan melakukan crawling data pada twitter menggunakan kata kunci "polusi udara jakarta" yang diambil dari periode 1 Agustus sampai 31 Agustus 2023 dan mendapatkan data sebanyak 510 data tweet. Selanjutnya melalui tahapan labelling data dibagi menjadi dua sentimen dan didapatkan hasil untuk sentimen positif sebanyak 208 data dan sentimen negatif sebanyak 284 data. Tahapan ketiga yaitu text preprocessing untuk mempermudah perhitungan pada tahap selanjutnya. Alur preprocessing yaitu case folding, cleansing, remove duplicate, tokenization, normalization, stopword removal, dan stemming. Setelah dilakukan pembersihan data diperoleh 492 data tweet yang kemudian data akan melalui proses pembobotan kata TFIDF.
Klasifikasi dengan metode NBC dan SVM dilakukan uji sebanyak 4 kali berdasarkan 4 perbandingan pembagian data latih dan data uji diantaranya 90:10, 80:20, 70:30, dan 60:40. Pengujian performa dilakukan dengan perhitungan akurasi, precision, recall, dan f1 score yang menghasilkan nilai performa tertinggi diperoleh metode NBC perbandingan data 90:10 dengan nilai akurasi 80%, precision 0,85, nilai recall sebesar 0,88 serta nilai f1 score sebesar 0,82. Sedangkan metode SVM tertinggi pada perbandingan 70:30 dengan nilai akurasi sebesar 77,027%. Pada penelitian ini diperoleh nilai rata-rata performa tertinggi pada metode NBC dengan perbandingan 90:10 dengan nilai precision, recall, dan f1 score secara berurutan sebesar 0,81, 0,80, dan 0,80.

Item Type: Thesis (Undergraduate (S1))
Uncontrolled Keywords: Polusi udara; sentimen; Twitter; NBC; SVM
Subjects: 000 Computer science, information, general works > 005 Computer programming, programs, data
Divisions: Fakultas Sains dan Teknologi > 59201 - Teknologi Informasi
Depositing User: Ukhtiya Zulfa
Date Deposited: 19 Sep 2025 02:54
Last Modified: 19 Sep 2025 02:54
URI: https://eprints.walisongo.ac.id/id/eprint/27717

Actions (login required)

View Item
View Item

Downloads

Downloads per month over past year

View more statistics