Analisis kinerja algoritma data mining K-Nearest Neighbor (KNN) dan naive bayes untuk klasifikasi keluhan masyarakat terhadap solusi penanganan sampah
Mahatiara, Rayhan Elena (2023) Analisis kinerja algoritma data mining K-Nearest Neighbor (KNN) dan naive bayes untuk klasifikasi keluhan masyarakat terhadap solusi penanganan sampah. Undergraduate (S1) thesis, Universitas Islam Negeri Walisongo Semarang.
1908046003_Rahyan Elena Mahatiara_full skripsi - Rahyan Elena Mahatiara UIN Walisongo Semarang.pdf - Accepted Version
Available under License Creative Commons Attribution Non-commercial No Derivatives.
Download (2MB)
Abstract
Sampah merupakan masalah utama yang terdapat disetiap daerah, sehingga peneliti akan mengangkat sampah menjadi objek untuk penelitian. Dalam penelitian ini akan membandingkan metode yang terdapat dalam data mining yaitu K-Nearest Neighbor (KNN) dengan Naive Bayes pada aplikasi media sosial twitter dengan tujuan mengetahui klasifikasi keluhan masyarakat terhadap penanganan sampah dan membandingkan tingkat keakuratan pada kedua metode tersebut. Pengambilan data yang digunakan dalam penelitian ini menggunakan software Rapid Miner dengan hastag sampah dengan skala waktu 05 Agustus hingga 22 Agustus 2022, data yang terambil dalam proses ini sejumlah 500 data. Setelah dilakukannya crawling data dilanjut dengan proses cleaning data, dalam proses ini data dibersihkan dari noise sehingga data berubah menjadi 149 data dengan data berupa sentiment positif sejumlah 70 data dan sentiment negatif sejumlah 79 data dan pembagian rasio data dilakukan oleh split data dengan perbandingan 80:20, dengan presentasi 80% data training dan 20% data testing, maka dengan itu data training memiliki sentiment positif sebanyak 52 data dan sentiment negatif sebanyak 67 data dan data testing memiliki sentiment positif sebanyak 18 data dan sentiment negatif sebanyak 12 data. Kemudian data tersebut diolah menggunakan 2 metode yaitu KNN dan Naive Bayes dengan bantuan google colab dengan bahasa pemrograman phyton, berdasarkan analisis kata yang sering muncul pada tweet adalah “kotor” dan “bau” dan diperoleh data dengan menggunakan algoritma Naive Bayes memiliki tingkat keakurasian lebih baik dibanding dengan algoritma KNN yaitu memiliki tingkat keakurasin 93% sedangkan dengan menggunakan KNN memiliki tingkat keakurasi 83%.
Item Type: | Thesis (Undergraduate (S1)) |
---|---|
Uncontrolled Keywords: | Sampah; Naive bayes; K-Nearest Neighbor (KNN) |
Subjects: | 500 Natural sciences and mathematics > 510 Mathematics |
Divisions: | Fakultas Sains dan Teknologi > 44201 - Matematika |
Depositing User: | Wati Rimayanti |
Date Deposited: | 04 Nov 2024 06:40 |
Last Modified: | 04 Nov 2024 06:40 |
URI: | https://eprints.walisongo.ac.id/id/eprint/24833 |
Actions (login required)
Downloads
Downloads per month over past year