ANALISIS KINERJA ALGORITMA DISTRIBUTED SUPPORT VECTOR MACHINE MENGGUNAKAN SPARK UNTUK MEMPREDIKSI PENUNDAAN PENERBANGAN

Husnul, Khotimah (2023) ANALISIS KINERJA ALGORITMA DISTRIBUTED SUPPORT VECTOR MACHINE MENGGUNAKAN SPARK UNTUK MEMPREDIKSI PENUNDAAN PENERBANGAN. S1 thesis, Universitas Mataram.

[img] Text
LAPORAN TUGAS AKHIR - F1D019032 - HUSNUL KHOTIMAH - TEKNIK INFORMATIKA.pdf
Restricted to Repository staff only

Download (1MB)
[img]
Preview
Text
JURNAL TUGAS AKHIR - F1D019032 - HUSNUL KHOTIMAH - TEKNIK INFORMATIKA.pdf

Download (488kB) | Preview
[img] Image
POSTER TUGAS AKHIR - F1D019032 - HUSNUL KHOTIMAH - TEKNIK INFORMATIKA.png
Restricted to ["security_typename_anyone" not defined]

Download (716kB)

Abstract

Dalam analisis big data, diperlukan kerangka kerja, strategi, dan lingkungan machine learning yang kuat untuk menganalisis data dalam skala besar. Oleh karena itu, Apache Spark digunakan sebagai framework cluster computing untuk mengolah big data secara paralel dan dapat berjalan di banyak cluster. Dalam penelitian ini, digunakan algoritma Support Vector Machine (SVM) sebagai metode klasifikasi untuk memprediksi apakah suatu penerbangan akan mengalami keterlambatan kedatangan atau tidak. Penelitian ini juga bertujuan untuk menganalisis kinerja algoritma SVM terdistribusi dengan menggunakan framework Apache Spark dalam melakukan klasifikasi kedatangan penerbangan yang tertunda. Evaluasi running time sangat berperan penting dalam membuktikan seberapa cepat proses pengolahan data dilakukan dengan menggunakan Apache Spark. Selain itu, terdapat pengujian untuk membuktikan pengaruh penggunaan algoritma SVM dengan sistem terdistribusi pada hasil akurasi klasifikasi kedatangan penerbangan yang tertunda. Pengujian kinerja SVM terdistribusi dilakukan dengan menggunakan variasi ukuran data dan jumlah worker node pada cluster yang dibangun. Dari hasil pengujian didapatkan jumlah worker node yang paling efektif digunakan pada proses klasifikasi penundaan penerbangan ini adalah 4 worker node dengan hasil running time terendah dari percobaan 4 variasi jumlah worker node. Pada penggunaan 4 worker node dengan data 2gb, waktu eksekusi dari program yaitu selama 10,2 menit. Dalam hal akurasi penambahan jumlah worker node tidak mempengaruhi hasil akurasi dari program. Perbedaan hasil akurasi disebakan oleh proses random oversampling pada data yang dilakukan pada setiap pengujian sistem. Penggunaan algoritma SVM dengan Spark cukup memberikan performa yang baik dalam proses klasifikasi dengan hasil akurasi tertinggi pada pengujian adalah 93.98%.

Item Type: Thesis (S1)
Keywords (Kata Kunci): Big data, Apache Spark, Support Vector Machine, Distributed Computing, Klasifikasi Penundaan Penerbangan
Subjects: T Technology > TD Environmental technology. Sanitary engineering
Divisions: Fakultas Teknik
Depositing User: Meike Megawati
Date Deposited: 28 Jul 2023 01:41
Last Modified: 28 Jul 2023 01:41
URI: http://eprints.unram.ac.id/id/eprint/41803

Actions (login required)

View Item View Item