Aplikasi Data Mining Menggunakan Algoritma ID3 Untuk Mengklasifikasi .

8d ago
0 Views
0 Downloads
811.76 KB
10 Pages
Last View : 8d ago
Last Download : n/a
Upload by : Jacoby Zeller
Transcription

Aplikasi Data Mining Menggunakan Algoritma ID3 UntukMengklasifikasi Kelulusan Mahasiswa Pada Universitas DianNuswantoro SemarangDanny Himawan11,3Jurusan Teknik Informatika, FASILKOM UDINUSJln. Nakula 1 No 5-11 Semarang 50131 [email protected] — Seorang mahasiswa dinyatakan lulus tepat waktu jika dapat menyelesaikan pendidikan selama minimal 8 semester atau 4 tahun.Untuk mewujudkan hal tersebut, perkembangan nilai Indeks Prestasi sangat membantu dalam proses penyelesaian skripsi suatu mahasiswa.Dengan memantau hasil belajar di universitas berupa nilai IP tiap semester, seorang mahasiswa dapat dinyatakan lulus tepat waktu atautidak.Pada penelitian ini dibuat aplikasi untuk Mengklasifikasi kelulusan mahasiswa menggunakan teknik data mining dengan algoritma ID3,hal tersebut bertujuan untuk melihat hasil perkembangan mahasiswa apakah dapat lulus tepat waktu atau tidak .Kata kunci — Data Mining, Klasifikasi, ID3, Prediksi kelulusan mahasiswa UDINUS SEMARANG.Abstract— One student graduated on time if it can complete education for a minimum of 8 semesters or 4 years. To achieve this goal,the development of value GPA is very helpful in the process of completion of a student thesis. By monitoring the learning outcomes inthe form of the value of IP university each semester, a student can be passed on time or tidak.Pada this study made an application forgraduation Classifying students using data mining techniques with ID3 algorithm, that aims to see whether the results of thedevelopment of students can graduate on time or not.Keywords— Data Mining, Classification, ID3, Prediction Graduation UDINUS SEMARANGI. PENDAHULUANMahasiswa merupakan aspek penting dalam evaluasikeberhasilan penyelenggaraan program studi pada suatuperguruan tinggi. Dalam masa pembelajarannya, mahasiswaberkembang untuk meningkatkan pola pikir kecerdasansebagai langkah awal untuk memasuki dalam persaingan didunia kerja dan lingkungan masyarakat kelak [1]. Kualitasdari sebuah perguruan tinggi selain dapat dilihat dari rata-ratalama lulusannya mendapatkan pekerjaan juga dapat dilihatdari rata-rata masa atau lama studi dari mahasiswanya.Berdasar pada peraturan yang disampaikan dalam buku IIstandard dan prosedur tentang akreditasi institusi perguruantinggi oleh BAN-PT ( Badan Akreditasi Nasional PerguruanTinggi) pada tahun 2011 menyatakan bahwa salah satu aspekpenilaian akreditasi adalah mahasiswa dan lulusan. Khususmengenai evaluasi standar mahasiswa dan lulusan, komponenyang dinilai adalah system rekrutmen mahasiswa baru, danlulusan ( rata-rata studi dan IPK ) [1]. Jadi, tingkat kelulusandan jumlah mahasiswa akan berpengaruh dalam prosesakreditasi yang dilakukan oleh pemerintah. Salah satupermasalahan utama dari institusi perguruan tinggi adalahuntuk meningkatkan kualitas pendidikan untuk mahasiswa danuntuk meningkatkan kualitas dari keputusan manajerialinstitusi. Sehingga tingkat kelulusan danjumlah mahasiswa akan berpengaruh dalam prosesakreditasi yang dilakukan pemerintah. Salah satu cara untukmencapai kualitas level mutu tertinggi dari sistem perguruantinggi adalah dengan menggali pengetahuan dari data bidangpendidikan sebagai atribut pembelajaranmempengaruhi pencapaian mahasiswa [2].utamayangUntuk Mengklasifikasi data dilakukan dengan berbagaicara, salah satunya dapat pula dilakukan dengan menggunakanteknik datamining. Teknik data mining sebagai sebuah teknikanalisis berbasis database dan statistic, sangatlah tepat untukmenggali berbagai potensi informasi yang terkandung dalamsebuah database.Pendekatan data mining berkembang untuk mengatasiberbagai permasalahan menyangkut tentang pengolahan data.Beberapa peneliti menggunakan teknik data mining untukmenyelesaikan permasalahan prediksi kelulusan mahasiswa[3] .Data mining adalah suatu cara yang bertujuan dalampenemuan pola secara otomatis atau semi otomatis dari datayang sudah ada di dalam database atau sumber data lain yangdimanfaatkan untuk menyelesaikan suatu masalah melaluiberbagai aturan proses [4].II. STUDI PUSTAKA2.1. Penelitian TerkaitAda beberapa referensi yang diambil penulis sebagaibahan pertimbangan untuk penelitian yang dilakukan,referensi tersebut diambil dari beberapa penulisan yangdilakukan sebelumnya yang membahas permasalahan yanghampir sama, antara lain :

1.2.3.Analisa dan Komparasi Metode Klasifikasi Data Mininguntuk Prediksi Kelulusan Mahasiswa.(Hilda Amalia,2012)Data Mining Classification untuk Prediksi Lama MasaStudi Mahasiswa Berdasarkan Jalur Penerimaan DenganMetode Naïve Bayes (Jonh Fredrik Ulysses, 2012)Graduation Prediction of Gunadarma Student Using NaïveBayes and Decision Tree (Suhartina & Ernastuti, 2010)C. CRIPS-DMCross – Industry Standart Proses for Data Mining (CRIPS– DM) dikembangkan pada tahun 1996 oleh analis daribeberapa industry. CRIPS – DM menyediakan standart prosesdata mining sebagai pemecahan masalah secara umum daribisnis atau unit penelitian [10]. CRIPS – DM memiliki siklushidup yang terbagi dalam enam fase, yaitu :2.2. Tinjauan PustakaA. Kelulusan MahasiswaMahasiswa merupakan elite masyarakat yang mempunyaiciri intelektualitas yang lebih komplek dibandingkankelompok seusia mereka yang bukan mahasiswa, ataupunkelompok usia dibawah dan diatas mereka. Ciri intelektualitastersebut adalah kemampuan mahasiswa menghadapi,memahami dan mencari cara pemecahan masalah secaralebih sistematis [1].Kelulusan mahasiswa merupakan hal yang pentingdiperhatikan, karena penurunan jumlah kelulusan akanmemberikan dampak negative kepada jumlah kelulusan danakan menghilangkan jumlah pendapatan institusi dan jugaakan berpengaruh pada penilaian pemerintah dalam bentukstatus akreditasi institusi [8].B. Data MiningData Mining merupakan teknologi baru yang sangatberguna untuk membantu perusahaan-perusahaan menemukaninformasi yang sangant penting dari gudang data mereka.Beberapa aplikasi data mining focus pada prediksi, merekameramalkan apa yang akan terjadi dalam situasi baru dari datayang menggambarkan apa yang terjadi di masa lalu [4]. Datamining adalah proses menggali informasi atau pola dalam databerukuran besar untuk menemukan pola dari suatu data untukkeperluan tertentu. Di dalam data mining, data disimpansecara elektronik dan pencarian data dalam data mining secaraotomatis, atau dengan kata lain dijalankan secarakomputerisasi. Masalah-masalah yang ada dalam data miningdipecahkan dengan menganalisis data yang sudah ada dalamdatabase. Di dalam data mining, terdapat empat tahapanutama dalam pemrosesannya, yaitu :1. Input (Data).2. Metode (Algoritma Data Mining).3. Output (Pola atau Model atau Knowledge).4. Evaluation (Akurasi, AUC, RMSE, dan lainsebagainya).Data mining merupakan gabungan dari teori dan heuristic,berfokus pada seluruh proses penemuan knowledge dan poladari data. Peran utama dari data mining terbagi menjadi enamkategori, yaitu Deskripsi, Estimasi, Prediksi, Klasifikasi,Clustering, dan Asosiasi yang dimana setiap kategori memilikialgoritma masing-masing [10].Gambar 2.1 Siklus CRIPS – DM1.2.3.4.Bussines UnderstandingMerupakan tahap awal yang memahami tujuandan kebutuhan dari sudut pandang bisnis, kemudianmenterjemahkan pengetahuan ini ke dalampendefinisian masalah dalam data mining .Selanjutnya akan ditentukan rencana dan strategiuntuk mencapai tujuan tersebut.Data UnderstandingDalam tahap ini dilakukan pengumpulan data,mengenali lebih lanjut data yang akan digunakan.Data PreparationDalam tahap ini meliputi semua kegiatan untukmembangun dataset akhir ( data yang akan diprosespada tahap permodelan/modeling) dari data mentah.Tahap ini dapat diulang beberapa kali. Pada tahap inijuga mencakup pemilihan tabel, record, dan atributatribut data, termasuk proses pembersihan dantransformasi data untuk kemudian dijadikan masukandalam tahap permodelan (modeling).ModelingDalam tahap ini akan dilakukan pemilihan danpenerapan berbagai teknik pemodelan dan beberapaparameternya akan disesuaikan untuk mendapatkannilai yang optimal. Secara khusus, ada beberapateknik berbeda yang dapat diterapkan untukmasalahdata mining yang sama. Di pihak lain adateknik pemodelan yang membutuhan format datakhusus. Sehingga pada tahap ini masih memungkinankembali ke tahap sebelumnya.

5.6.EvaluationPada tahap ini, model sudah terbentuk dandiharapkan memiliki kualitas baik jika dilihat darisudut pandang analisa data. Pada tahap ini akandilakukan evaluasi terhadap keefektifan dan kualitasmodel sebelum digunakan dan menentukan apakahmodel dapat mencapat tujuan yang ditetapkan padafase awal (Business Understanding). Kunci daritahap ini adalah menentukan apakah ada masalahbisnis yang belum dipertimbangkan. Di akhir daritahap ini harus ditentukan penggunaan hasilproses data mining.DeploymentPada tahap ini, pengetahuan atau informasiyang telah diperoleh akan diatur dan dipresentasikandalam bentuk khusus sehingga dapat digunakan olehpengguna. Tahap deploymentdapat ikan proses data mining yangberulang dalam perusahaan. Dalam banyak kasus,tahap deployment melibatkan konsumen, di sampinganalis data, karena sangat penting bagi konsumenuntuk memahami tindakan apa yang harus dilakukanuntuk menggunakan model yang telah dibuat.D. Algoritma ID3Algoritma ID3 atau Iterative Dichotomizer 3 (ID3)merupakan sebuah metode yang digunakan untukmembuat pohon keputusan. Input dari algoritma ini adalahsebuah database dengan beberapa variabel yang jugadikenal dengan atribut [14]. Setiap masukan dalamdatabase menyajikan sebuah objek dari domain yangdisebut dengan variabel bebas. Sebuah atribut didesainuntuk mengklasifikasikan objek yang disebut denganvariabel tidak bebas.Proses klasifikasi dilakukan dari node paling atasyaitu akar pohon (roof). Dilanjutkan ke bawah melaluicabang-cabang sampai dihasilkan node daun (leafes)dimana node daun ini menunjukkan hasil akhir klasifikasi.Sebuah objek yang diklasifikasi dalam pohon harus ditesnilai entropinya. Entropi adalah ukuran dari teori informasiyang dapat mengetahui karakteristik impurity danhomogeneity dari kumpulan data. Dari nilai entropitersebut kemudian dihitung nilai information gain (IG)masing-masing atribut independent terhadap atributdependent-nya.Dimana :1. S adalah ruang (data) sample yang digunakan untuktraining.2. P adalah jumlah yang bersolusi positif (mendukung)pada data sample untuk kriteria tertentu.3. P adalah jumlah yang bersolusi negative (tidakmendukung) pada data sample untuk kriteria tertentu. Darirumus entropy diatas dapat disimpulkan bahwa definisientropy (S) adalah jumlah bit yang diperkirakandibutuhkan untuk dapat mengekstrak suatu kelas ( atau-)dari sejumlah data acak pada suatu ruang sampel S.Entropy bisa dikatakan sebagai kebutuhan bit untukmeyatakan suatu kelas. Semakin kecil nilai entropy makasemakin baik digunakan dalam mengekstraksi suatu kelas.Pajang kode untuk menyatakan informasi secara optimaladalah –log2p bits untuk messages yang mempunyaiprobabilitas p. Sehingga jumlah bit yang diperkirakanuntuk mengekstraksi S ke dalah kelas adalah : -p log2p -p log2p.IG merupakan nilai rata-rata entropi pada semua atribut.Secara ringkas, langkah kerja algoritma ID3 dapatdigambarkan sebagai berikut [7]:1. Penghitungan information gain dari setiap atributmenggunakanDimanaA: atributV: suatu nilai yang mungkin untuk atribut AValue (A): himpunan yang mungkin untuk atribut A Sv : Jumlah sampel untuk nilai v S : jumlah seluruh sampel dataEntropy(Sv) : entropy untuk sampel-sampel yangmemiliki nilai v2. Pemilihan atribut yang memiliki nilai information gainterbesar,3. Pembentukan simpul yang berisi atribut tersebut,Ulangi proses perhitungan information gain akanterus dilaksanakan sampai semua data telah masuk dalamkelas yang sama. Atribut yang telah dipilih tidak diikutkanlagi dalam perhitungan nilai information gain.2.3. Kerangka PemikiranMasalah yang ditemui pada penelitian ini adalahbagaimana cara memprediksi ketepatan kelulusanmahasiswa dengan menggunakan teknik data mining.Dimana faktor nilai IPK sampai dengan semester IV danfaktor data induk mahasiswa yang berupa jenis kelamin,kota tempat tinggal, status bekerja atau tidak, dan statuspernikahan akan menjadi variable prediktornya. Metodeyang akan digunakan adalah klasifikasi dengan algoritmaID3.

Gambar 2. 2 Kerangka PemikiranIII. METODOLOGI PENELITIAN3.1. Intrumen PenelitianPenelitian ini dilakukan berdasarkan permasalahan yangtelah di uraikan pada bab sebelumnya. Adapun metodepenelitian dalam penelitian ini adalah :A. Pengumpulan DataData pada penelitian ini diambil dari PSI UDINUSSemarang yang beralamat di Jalan Nakula I No. 5-11,Semarang Provinsi Jawa Tengah pada bulan Maret 2014.Berupa data mahasiswa Fakultas Ilmu Komputer UDINUSangkatan tahun 2008, 2009 dan 2010.B. Metode pengembangan perangkat lunak1. Perancangan dan analisisDalam penelitian ini, digunakan Cross IndustryStandard Processing-Data Mining ( CRISP-DM )sebagai metode analisis data dan pemodelan dengantahapan fase sebagai berikut :a. Fase Pemahaman Bisnis ( BusinessUnderstanding Phase )b. Fase Pemahaman Data ( Data UnderstandingPhase )c. Fase Pengolahan Data ( Data PreparationPhase )d. Fase Pemodelan ( Modeling Phase )e. Fase Evaluasi ( Evaluation Phase )f. Fase Penyebaran ( Deplyment Phase )2. Pembuatan ProgramPembuatan program adalah tahap coding aman JAVA, library SPMF untuk menanganitugas data mining dan Netbeans IDE sebagai perangkatpembangunan. Beberapa kegiatan yang dilakukan padapembuatan program meliputi: Desain alur program. Desain User Interface (GUI).Penyisipan algoritma ID3 pada program.Penyisipan dataset trainingPembuatan fitur simpan hasil mining ke dalambentuk *.txt sehingga dapat disimpan / dicetakhasil miningnya.Pembuatan fitur input untuk menginputkanatribut untuk proses mining.Pembuatan fitur bantuan untuk memandu userawam menggunakan program.3. Pengujian softwareTahap pengujian adalah tahap pembenahan fungsi program,pencarian dan koreksi kesalahan program baik kesalahansintaks ( Syntax Error ) maupun kesalahan saat programdijalankan. Dalam pembangunan software ini, menggunakanmetode pengujian White Box dan Black Box.4. Evaluasi Kualitas SoftwareAdalah tahap penilaian secara objektif yang dilakukandengan penyerahan program dan pengisian kuisoner seputarperforma program prediksi data mining pada mahasiswa FIKUDINUS yang dipilih secara acak dan tidak mengetahuitentang data mining. Untuk poin-poin yang akan diuji padatahap evaluasi kualitas software adalah : Probabilitas, pengujian kualitas apakah software cukupportable dalam hal instalasi. Kemudahan, pengujian kualitas apakah software cukupmudah untuk dioperasikan untuk pengguna awam. Desain, pengujian kualitas apakah desain User Interfacemudah dipahami atau tidak. Kegunaan, pengujian kualitas seberapa besar manfaat yangnantinya dapat diperoleh dengan adanya modul datamining.IV. HASIL DAN PEMBAHASAN4.1. Perancangan dan AnalisisA. Perancangan sistemTeknik pemecahan masalah pada analisis system yangmenggabungkan kembali komponen system menjadi systemyang utuh. Ada tiga point utama yang akan dibahas pada tahapperancangan :4.1.1 User CommunicationKomunikasi yang terjadi antara pengguna denganprogram dengan respon yang diberikan oleh system.Yaitu analisis kebutuhan user, use case diagram, dandiagram aktifitas.4.1.1.1 Analisis Kebutuhan han yang diperlukan dalam pengembanganperangkat lunak. Suatu system yang akandikembangkan harus memenuhi kebutuhan fungsional

sehingga program dapat berjalan dengan optimalsehingga mendukung fungsi utama dalam program agarberjalan sesuai yang diharapkan.1. Kebutuhan Fungsionala. Sistem harus menyediakan fungsi untuk mengimpordataset sebagai data training.b. Sistem harus menyediakan fungsi untuk miningsebagai layanan utama dalam program ini.c. Sistem harus menyediakan fungsi untukmenyimpan hasil mining sebagai output dalam bentukfile teks.2. Kebutuhan Non-Fungsionala. Sistem menyediakan layanan bantuan agarpengguna lebih mudah dalam mengoperasikan program4.1.1.2pengguna diharuskan mengimpor dataset sebagai inputanuntuk proses mining, setelah pengguna berhasil melakukanproses mining, hasil proses yang terbentuk dapat disimpanpada file teks.4.1.1.3 Activity DiagramUse Case DiagramUse case diagram yang akan disusun pada perangkatlunak ini memerlukan actor sebagai pelaku yangmenjalankan case-case yang ada. Berikut adalahlangkah membuat diagram use case dalam softwareprediksi kelulusan mahasiswa pada Universitas DianNuswantoro Semarang:1.Identifikasi AktorAktor adalah pelaku bisnis atau subjek yangmenjalankan case pada software. Aktor yang terlibatdalam system ini secara khusus adalah petugasakademik fakultas yang memantau perkembangan nilaimahasiswa. Namum baik pengguna secara umummaupun petugas akademik UDINUS Semarangmemiliki case yang sama, hal ini dikarenakan softwareyang dibuat tidak memerlukan otentikasi sebagai linikeamanan sehingga software ini dapat digunakan olehsemua pengguna.2.Diagram Model Use CaseAdalah penjabaran secara grafis kegiatan yangdilakukan oleh pengguna selama berada didalamsystem atau softwareGambar 4.1 Use Case DiagramDiagram use case di atas menggambarkan bahwapengguna dapat melakukan impor dataset sebagai inputanproses mining, proses mining, menampilkan hasil mining, danmenyimpan hasil proses mining. Untuk melakukan mining,Gambar 4.2 Activity DiagramGambar di atas menjelaskan bagaimana penggunamelakukan proses mining. Ketika pertama kali penggunamenjalankan program, pengguna akan masuk ke dalamhalaman spashcreen. Pengguna dapat memilih apakah masukhalaman utama atau keluar dari program. Aktifitas akanberhenti jika pengguna memilih keluar dari program. Jikapengguna memilih masuk maka pengguna akan masuk kedalam halaman utama.Untuk melakukan proses mining pengguna diharuskanmengimpor dataset training sebagai data training pada prosesmining. Pengguna dapat membatalkan impor dataset dankembali pada halaman utama. Jika proses impor dataset gagalmaka proses impor akan dibatalkan dan kembali pada halamanutama.Setelah dataset diimpor oleh pengguna dan berhasil, makaproses mining dapat dilakukan. Setelah proses impor berhasilpengguna masuk ke dalam form inputan berupa kategorikategori yang akan di prediksikan. Setelah pengisian inputanmaka proses mining dilakukan. Setelah proses mining berhasilprogram akan menampilkan hasil mining berupa statisticmining yang dapat disimpan pada bentuk file teks dan aktifitasselesai.

4.2. Prototype CyclesDesain antarmuka adalah tahap pembuatan tampilansoftware agar lebih menarik sehingga pengguna dapatmengoperasikan software dengan mudah.Gambar 4. 6Halaman Dataset TrainingGambar 4. 3 Halaman SplashscreenGambar 4.7 Halaman Input pada rancangan programGambar 4. 4 Halaman UtamaGambar 4.8 Halaman hasil proses mining pada rancanganprogramGambar 4. 5 Halaman Input DatasetGambar 4.9 Halaman simpan hasil rancangan program

4.3. Pengujian dan implementasiSebelum perengkat lunak dirilis untuk pengguna hal yangperlu dilakukan adalah melakukan pengujian apakahprogram sudah memenuhi standar kelayakan pakai atauterdapat bug yang menyebabkan program tidak dapatberjalan dengan baik.4.3.1 Pengujian Perangkat Lunak Dengan Metode White-BoxTestingPengujian white box bertujuan untuk memastikanstruktur semua statemen pada program telah dieksekusipaling tidak satu kali pengujian dan tidak dijumpai erormessage. Pengujian ini menggunakan basis path yangmemungkinkan pengukuran kompleksitas logis dari desainprocedural sebagai pedoman penetapan basis set pada tiapeksekusi. Dalam penelitian ini test care dilakukan hanyasatu kali untuk memastikan program sudah dapat berjalandengan prosedur perancangan. Adapun contoh pengujianyang diambil dalam penelitian ini adalah proses output.Gambar 4.11 Flowgraph EvaluasiDari gambar 4.11 dapat diketahui :Edge (E) 12Region (R) 5Predikat Node 5Node (N) 9a. Menghitung Nilai Cyclomatic Complexity (CC)Cyclomatic Complexity digunakan untuk mencari jumlahpath dalam satu flowgraph. Cyclomatix Complecity V(G)untuk grafik alir dihitung dengan rumus:V(G) E – N 2Dimana :E jumlah edge pada grafik alirN jumlah node pada grafik alirGambar 4.10 Bagan alir evaluasimakaV(G) 12 – 9 2 5Jadi Cyclomatic Complexity untuk flowgraph evaluasi adalah5. Berdasarkan tabel hubungan antara Cyclomatic Complexitydan Resiko menurut McCabe, menunjukkan bahwa nilai CC 5– 10 masuk dalam type of procedure a well structured andstable procedure ( strukturnya baik dan procedure stabil ) sertaresikonya Low (rendah).b. Menentukan basis pathBasis set yang dihasilkan dari jalur independent secaralinier adalah jalur sebagai berikut :

Tabel 4.1 Pengujian basis pathdieksekusi satu kali. Berdasarkan ketentuan tersebut darisegi kelayakan software, system ini telah memenuhi syarat.4.3.2 Pengujian Perangkat Lunak Dengan Black-BoxTestingPengujian black box dilakukan untukmemastikan bahwa suatu event atau masukan akanmenjalankan proses yang tepat dan menghasilkanoutput sesuai dengan rancangan. Untuk contohpengujian terhadap beberapa proses memberikanhasil sebagai berikut:Tabel 4.2 Hasil Pengujian Black Box Terhadap BeberapaProsesDari hasil pengujian dapat disimpulkan untuk uji black boxyang meliputi uji input proses dan output dengan acuanrancangan perangkat lunak telah terpenuhi dengan hasilsesuai dengan rancangan. Uji juga dilakukan pada programutama dan program pendukung lainnya.4.4 Hasil PenelitianPada pembahasan, penulis akan mengevaluasi hasilprediksi mining dengan data real yang sudah terjadi, sehinggaterlihat seberapa akurat proses mining pada program aplikasidata mining ini, berikut hasil penelitiannya4.4.1 Evaluasi Hasil Data Mining Menggunakan 100 DatasetHasil penelitian menggunakan data mahasiswa TeknikInformatika UDINUS angkatan tahun 2009 menghasilkanhasil sebagai berikut :Pada saat aplikasi dijalankan, makan terlihat bahwasemua basis set tereksekusi dengan baik dan simpul telah

Tabel 4.3 Hasil Uji 1Dari tabel diatas, dihasilkan prediksi menggunakan 100dataset dengan 10 sampel hasilnya adalah benar semua.V. PENUTUPA. KesimpulanDari tabel diatas, dihasilkan prediksi menggunakan 100dataset dengan 10 sampel prediksi adalah 2 salah dan 8sampel benar.4.4.2 Evaluasi Hasil Data Mining Menggunakan 1000DatasetHasil penelitian menggunakan data mahasiswa TeknikInformatika UDINUS angkatan tahun 2009 menghasilkanhasil sebagai berikut :Tabel 4.4 Hasil Uji 2Dari hasil penelitian yang telah dilakukan didapat kanbahwa pada percobaan dengan 100 dataset dengan 10sampel uji hasil yang diharapkan tidak mencapai yangdiinginkan karena dengan 10 sampel uji 8 sampel tepatdan 2 sampel tidak tepat. Sama hal nya dengan 1000dataset dengan 10 sampel uji hasil yang diharapkan tidakmencapai yang diinginkan karena dengan 10 sampel uji 8sampel tepat dan 2 sampel tidak tepat. Sedangkan padapercobaan dengan seluruh dataset / 1469 data dengan 10sampel uji, semua sampel uji tepat. Sehingga dapatdisimpulkan bahwa semakin sedikit data training yangdigunakan maka hasil klasifikasinya menunjukkanketidakakuratan yang tinggi. Sebaliknya jika data trainingyang digunaan semakin banyak hasilnya akan semakinakurat. Software klasifikasi yang telah disusun dapatdigunakan untuk menentukan klasifikasi potensi ketepatankelulusan pada mahasiswa UDINUS Semarang.B. SaranPenelitian ini memiliki banyak kekurangan dan masih dapatdikembangkan lagi pada penelitian berikutnya. Beberapasaran untuk pengembangan penelitian selanjutnya adalah1.Dataset sebagai dataset training ditingkatkan agar polamining yang terbentuk semakin bervariasi.2.Variabel prediksi ditambahkan agar hasil prediksi mendekatisempurna.Dari tabel diatas, dihasilkan prediksi menggunakan 1000dataset dengan 10 sampel prediksi adalah 2 salah dan 8sampel benar.4.4.3 Evaluasi Hasil Data Mining Menggunakan1469DatasetHasil penelitian menggunakan data mahasiswa TeknikInformatika UDINUS angkatan tahun 2009 menghasilkanhasil sebagai berikut :3.Penelitian ini menggunakan dataset dari gunakan dataset yang lainnya, dari dataset private ataudataset public.4.Program pada penelitian ini masih berupa model prototypesehingga masih dapat dikembangkan lagi menggunakan toolsatau bahasa pemrograman yang lainnya.5.Hasil proses mining yang terbentuk dapat dikembangkanmenjadi basis pengetahuan untuk system pendukungkeputusan maupun system rekomendasi yang akan dilakukanoleh mahasiswa bila hasil yang didapat tidak sesuai denganyang diinginkan.6.Penelitian selanjutnya dapat dikembangkan pada jenis datayang serupa dengan metode yang lebih baik seperti c50 atauj48.UCAPAN TERIMA KASIHPenulis mengucapkan teima kasih kepada Universitas DianNuswantoro, Rektor UDINUS, Dekan Fakultas IlmuKomputer, Kaprodi Teknik Informatika-S1, Dosenpembimbing, Dosen-dosen pengampu kuliah di Fakultas IlmuKomputer , serta teman-teman dan sahabat yang selama ini

telah mendampingi penulis selama kuliah di Universitas DianNuswantoro.[8]Amalia, Hilda. (2012).”Komparasi Metode Klasifikasi Data Mining UntukPrediksi Ketepatan Kelulusan Mahasiswa. Jakarta : STIMIK Nusa Mandiri.REFERENSI[9]Quadri, M. N., & Kalyankar, N. V. (2010). Drop Out Feature of StudentData for Academic Performance Using Decision Tree techniques. GlobalJournal of Computer Science and Technology, 2-4.[1] Muarif, Khoirul. (2013).Komparasi Pemodelan Data Menggunakan C4.5Dan C4.5 Berbasis Particle Swarm Optimization Untuk MemprediksiKelulusan Mahasiswa. Semarang :Universitas Dian Nuswantoro.[2]Abu Tair Mohammed M., El-Halees Alaa M. Mining, Educational Data toImprove Students’ Performance: A Case Study, 2012, International Journal ofInformation and Communication Technology Research, Volume 2 No. 2, pp140-146.[3]Suhartina & Ernastuti.(2010).Graduation Prediction of Gunadarma StudentUsing Naive Bayes and Decision Tree.Jakarta:Universitas Gunadarma.[4]Witten, H.I.,Eibe,F.,& Hall,A.M.(2010).Data Mining Machine LearningTools and Techniques.Burlington:Morgan Kaufmann Publisher[5]Vercellis, Carlo (2009). Business Intelligent: Data Mining andOptimization for Decision Making. Southern Gate. Chichester, West Sussex:John Willey & Sons,Ltd.[6]Gorunescu, Florin. (2011). Data Mining: Concepts and Techniques. Verlagberlin Heidelberg: Springer.[7 Defiyanti Sofi.(2010). Perbandingan Kinerja Algoritma ID3 Dan C4.5Dalam Klasifikasi Spam-Mail. Bekasi:Universitas Gunadarma.[10]Larose, D. T. (2005). Discovering Knowledge in Data. New Jersey: JohnWilley & Sons, Inc.[11]Han, J., & Kamber, M. (2007). Data Mining Concepts and Techniques.San Fransisco: Mofgan Kaufan Publisher.[12]Wu, X., & Kumar, V. (2009). The Top Ten Algorithms in Data Mining.Taylor & Francis Group, LLC.[13]Kusrini, & Luthfi, E. T. (2009). Algoritma Data Mining. Yogyakarta:Andi Publishing.[14]Giovani Ronny, Mudjihartono Paulus, Pranowo. (2011). SistemPendukung Keputusan Prediksi Kecepatan Studi Mahasiswa MenggunakanMetode ID3. Yogyakarta: Universitas Atma Jaya.[15]P.J.Deitel, Java(tm) for Programmers: Deitel(r) Developer Series.Prentice Hall, 2009.[16] I. Sommerville, Software Engineering, 9th ed. Boston: Education, Inc,2011.[17] J. M. Kerr and R. Hunter, Inside RAD: How to Build a Fully FunctionalSystemin90DaysorLess.McGraw-Hill.,1993.

Di dalam data mining, terdapat empat tahapan utama dalam pemrosesannya, yaitu : 1. Input (Data). Tahap ini dapat diulang beberapa kali. Pada tahap ini 2. Metode (Algoritma Data Mining). 3. Output (Pola atau Model atau Knowledge). 4. Evaluation (Akurasi, AUC, RMSE, dan lain sebagainya).