tugas kapsel_yenni dwi ariyani_140110100046

7/22/2019 Tugas Kapsel_Yenni Dwi Ariyani_140110100046

1/28

Yenni Dwi Ariyani -140110100046

APLIKASI DATA MININGUNTUK MENAMPILKANINFORMASI TINGKAT

KELULUSAN MAHASISWADisusun oleh:

Nuqson Masykur Huda - J2F005280Program studi teknik informatika

Jurusan matematikaFakultas matematika dan ilmu pengetahuan alam

Universitas Diponegoro


2/28

Data Mining

Data Mining merupakan salah satu prosesdari keseluruhan proses yang ada padaKnowledge Discovery in Databases (KDD).

Data Mining adalah penambangan ataupenemuan informasi baru dengan mencaripola atau aturan tertentu dari sejumlah datayang sangat besar

Data mining adalah kegiatan menemukan

pola yang menarik dari data dalam jumlah

besar


3/28

Knowledge Discovery inDatabases (KDD)

Knowledge Discovery in Databases (KDD)merupakan sekumpulan proses untuk

menemukan pengetahuan yang bermanfaatdari data.

Data mining merupakan proses yang sangatpenting dalam menemukan pola-pola yang

berguna dari sejumlah data yang besar (datatersebut bisa disimpan dalam basisdata, DataWarehouse, atau media penyimpananinformasi lainnya).


4/28

Tahapan Knowledge Discovery inDatabases (KDD)

1. Pembersihan data (data cleaning)Pembersihan data merupakan proses menghilangkan noise dan data yangtidak konsisten atau data tidak relevan.

2. Integrasi data (Data Integration)penggabungan data dari berbagai database ke dalam satu database baru.

3. Seleksi Data (Data Selection)Mengidentifikasi semua sumber informasi internal dan eksternal dan memilihsebagian saja dari data yang diperlukan untuk aplikasi data mining.

4. Transformasi data (Data Transformation)Data diubah atau digabung ke dalam format yang sesuai untuk diprosesdalam data mining

5. Penambangan data (Data Mining)

proses mencari pola atau informasi menarik dalam data terpilih denganmenggunakan teknik atau metode tertentu

6. Presentasi pengetahuan (Knowledge Presentation).Visualisasi dan penyajian pengetahuan mengenai metode yang digunakanuntuk memperoleh pengetahuan yang diperoleh pengguna.


5/28

Algoritma Apriori

Algoritma apriori adalah algoritma paling terkenaluntuk menemukan pola frekuensi tinggi.

Pola frekuensi tinggi adalah pola-pola item di dalamsuatu database yang memiliki frekuensi atau supportdi atas ambang batas tertentu yang disebut denganistilah minimum support atau threshold.

Threshold adalah batas minimum transaksi. Jikajumlah transaksi kurang dari threshold maka item ataukombinasi item tidak akan diikutkan perhitunganselanjutnya.

Penggunaan threshold dapat mempercepatperhitungan


6/28

Analisis data miningPada tahap ini akan dicari nilaisupport dan confidence dari hubungantingkat kelulusan dengan data induk mahasiswa. Support (nilai

penunjang) yaitu prosentase kombinasi item tersebut dalam database

dan confidence (nilai kepastian) yaitu kuatnya hubungan antar item

dalam aturan assosiatif

Data induk mahasiswa yang akan dicari hubungannya adalah :

1. Hubungan tingkat kelulusan dengan proses masuk

2. Hubungan tingkat kelulusan dengan asal sekolah dan proses masuk

3. Hubungan tingkat kelulusan dengan kota asal sekolah

4. Hubungan tingkat kelulusan dengan program studi


7/28

Sumber DataData yang digunakan terdiri dari dua sumber yaitu :

Data induk mahasiswa

Data induk mahasiswa adalah data mahasiswa yangdidata ketika mahasiswa pertama kali masuk perguruantinggi setelah melakukan registrasi ulang Data yang

dicatat adalah identitas pribadi mahasiswa danidentitas sekolah asal mahasiswa.

ata Kelulusan

Data Kelulusan adalah data mahasiswa yang telahdinyatakan lulus. Data yang dicatat adalah identitasmahasiswa dan data kelengkapan kelulusan


8/28

Tabel data induk mahasiswa :


9/28

Tabel data kelulusan


10/28

Pembersihan data Dilakukan pembersihan data karena tidak

semua data pada tabel akan digunakan.Pembersihan ini penting guna meningkatkan

performa dalam proses mining.

Cara pembersihan dengan menghapusatribut yang tidak terpakai dan menghapus

data-data yang tidak lengkap isiannya.


11/28

Atribut yang digunakan dalam data indukmahasiswa adalah :

1. Atribut NIM2. Atribut proses masuk3. Atribut nama asal sekolah digunakan4. Atribut kota asal sekolah

Atribut yang digunakan dalam data kelulusanadalah :

1. NIM

2. Indeks Prestasi Kumulatif (IPK)3. Lama studi4. Program Studi


12/28

Integrasi Data

Data kelulusan dan data induk mahasiswa digabungkan

dengan primary key NIM. Setelah itu baru dilakukan proses

mining.

Proses integrasi data dilakukan ketika proses ETL

(ekstract, transform, and Load) ketika membangun data

warehouse, dalam proses ETL data dalam data source

digabungkan menjadi satu dalam data warehouse

dengan key NIM


13/28

Seleksi data

proses menyeleksi atribut apa yang

akan diproses pada mining selanjutnya.


14/28

Transformasi DataBeberapa metode data mining membutuhkan format data yang

khusus sebelum bisa Diaplikasikan. Dalam Aplikasi Data Mining ini,

data yang dirubah yaitu lama studi dan IPK untuk mengukur

tingkat kelulusan. Dari dua data tersebut dapat dibuat tabel

berikut :

Kategori Keterangan

A1 lama studi 4 tahun atau kurang dari 4 tahun dan IPK 3,514,00



B1 lama studi lebih dari 4 tahun dan IPK 3,514,00




15/28

Penggunaan AlgoritmaApriori Ide dasar dari algoritma ini adalah dengan

mengembangkan frequent itemset. Denganmenggunakan satu item dan secara rekursifmengembangkan frequent itemset dengan dua item, tigaitem dan seterusnya hingga frequent itemset dengan

semua ukuran.

Algoritma apriori dibagi menjadi beberapa tahap yangdisebut iterasi .

Langkah pertama algoritma apriori adalah, support darisetiap item dihitung dengan men-scan database. Setelahsupport dari setiap item didapat, item yang memilikisupport lebih besar dari minimum support dipilih sebagaipola frekuensi tinggi dengan panjang 1 atau seringdisingkat 1-itemset. Singkatan k-itemset berarti satu setyang terdiri dari k item


16/28

Penggunaan AlgoritmaAprioriUntuk selanjutnya iterasi iterasi ke-k dapat dibagi lagi menjadibeberapa bagian :

Pembentukan kandidat itemset

Kandidat k-itemset dibentuk dari kombinasi (k-1)-itemset yang didapat dariiterasi sebelumnya. Satu ciri dari algoritma apriori adalah adanyapemangkasan kandidat k-itemset yang subset-nya yang berisi k-1 item tidaktermasuk dalam pola frekuensi tinggi dengan panjang k-1

Penghitungan support dari tiap kandidat k-itemsetSupport dari tiap kandidat k-itemset didapat dengan men-scan databaseuntuk menghitung jumlah transaksi yang memuat semua item di dalamkandidat k-itemset tersebut. Ini adalah juga ciri dari algoritma apriori yaitudiperlukan penghitungan dengan scan seluruh database sebanyak k-itemsetterpanjang.

Tetapkan pola frekuensi tinggi

Pola frekuensi tinggi yang memuat k item atau k-itemset ditetapkan dari

kandidat k-itemset yang support-nya lebih besar dari minimum support.Kemudian dihitung confidence masing-masing kombinasi item. Iterasiberhenti ketika semua item telah dihitung sampai tidak ada kombinasi itemlagi.


17/28

Contoh proses mining untuk mengetahuihubungan tingkat kelulusan dengan proses

masukTerdapat data sebagai berikut :


18/28

Dari data awal dapat dapat dibuat data berikut :

Selanjutnya ditentukan threshold = 3 sehingga didapat :


19/28

Selanjutnya dari data tersebut yang digabungkan dengan data awaldapat dibuat data berikut :

Setelah ditentukan threshold = 3 maka didapat :

Sehingga didapatkan hasil sebagai berikut :

Support A2, PSSB = Count (A2,PSSB)/jumlah transaksi = 3/11 Support A3, SPMB = Count(A3, SPMB) /jumlah transaksi = 3/11 Confidence A2, PSSB = Count(A2,PSSB)/Count (A2) = 3/4 Confidence A3, SPMB = Count(A3,SPMB)/Count(A3) = 3/3


20/28

Dapat dilihat bahwa proses mining hubungan tingkatkelulusan dengan proses masuk mahasiswa denganthreshold 3 menghasilkan :

Hubungan A2, PSSB mempunyai nilai support = 3/11

Confidence =3/3 dan Hubungan A3, SPMB mempunyai nilai support = 3/11

Confidence = 3/4

Maka PSSB mempunyai tingkat kelulusan A2 dan SPMBmempunya tingkat kelulusan A3, sehingga dapat

disimpulkan bahwa mahasiswa yang melalui prosesmasuk PSSB mempunya tingkat kelulusan lebih bagusdibanding mahasiswa yang melalui proses masuk SPMB


21/28

Report dan Penyajian HasilProses

Setelah proses mining akan disajikan hasil dari datamining berupa tabel hubungan kekuatan dengan nilaisupport dan confidence masing-masing atribut serta

threshold yang digunakan. Semakin tinggi nilaiconfidence dan support maka semakin kuat nilaihubungan antar atribut.


22/28

Perangkat lunak dan perangkat keras

yang digunakan1) CPU

Prosesor Intel Celeron 2.66 Ghz Memori 1024 Gb VGA 128 bit Hardisk 160 GB

2) Sistem Operasi : Microsoft Windows 7 Professional 6.1

3) Editor Script : Notepad ++ v5.0.3.

4) Platform Microsoft Visual Studio 2008 Version 9.0.21022.8 Professional Edition Microsoft .NET Framework Version 3.5 SP1

5) DBMS : Microsoft SQL Server Management Studio 9.00.1399.00 Microsoft MSXML 3.0 4.0 5.0 6.0 Microsoft .NET Framework 2.0.50727.4927


23/28

Tampilan Program

Terdapat dua buah form yaitu Form pertama merupakan

halaman awal yang berisi perintah pengambilan data

pemilihan atribut data induk mahasiswa, input threshold,

perintah proses mining dan tombol keluar aplikasi. Form keduamerupakan halaman report data mining yang berisi hasil proses

data mining yaitu tabel nilai support dan confidence


24/28

Tampilan form 1


25/28

Tampilan form 2


26/28

Kesimpulan

Aplikasi Data Mining ini dapat digunakan untukmenampilkan informasi tingkat kelulusan. Informasi yangditampilkan berupa nilai support dan confidencehubungan antara tingkat kelulusan dengan data indukmahasiswa. Semakin tinggi nilai confidence dan supportmaka semakin kuat nilai hubungan antar atribut. Data

induk mahasiswa yang diproses mining meliputi data prosesmasuk, data asal sekolah, data kota mahasiswa, dan dataprogram studi.

Hasil dari proses data mining ini dapat digunakan sebagaipertimbangan dalam mengambil keputusan lebih lanjuttentang faktor yang mempengaruhi tingkat kelulusan

khususnya faktor dalam data induk mahasiswa.


27/28

TERIMA KASIH


28/28

[1] Huda, Nugson Masykur, 2010, APLIKASI DATA MINING UNTUK

MENAMPILKAN INFORMASI TINGKAT KELULUSAN MAHASISWA(Studi Kasus di Fakultas MIPA Universitas Diponegoro), Semarang

Daftar Pustaka

tugas kapsel_yenni dwi ariyani_140110100046

Documents