habib firdausi-algoritma c4.5.pptx
Post on 25-Feb-2018
254 Views
Preview:
TRANSCRIPT
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
1/20
Algoritma C4.5
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
2/20
Defnisi Algoritma C4.5
Beberapa pengertian C4.5 menurut:
a) Max Bremer, 2007 Metode yangdigunakan untuk membangun pohon keputusan
dengan menggunakan seperangkat aturan padasebuah dataset.
b) Xindong Wu and Vipin Kumar, 2008!"angkaian dari algoritma untuk masalah
klasifkasi dalam ma#hine learning dan datamining.
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
3/20
Defnisi Algoritma C4.5
AlgoritmaC4.merupakanalgoritmapembentuk pohon keputusan
$de#ision tree) untuk mengklarifkasidata yang besar men%adi lebih ke#ilhingga tiap bagian terdiri dari data
yang berasl dari kelas yang sama.
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
4/20
&elebihan C4.5
'. Daerah pengambilan keputusan dapat diubahmen%adi lebih spesifk
(. anya mengu%i sample atau kelas tertentu
sehingga perhitungan yang tidak diperlukanbisa dihilangkan
*. +leksibel memilih ftur yang akan membedakansuatu kriteria dalam node yang sama
4. Menggunakan kriteria yang %umlahnya lebihsedikit pada setiap#abang tanpa mengurangikualitas keputusan yang dihasilkan
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
5/20
&ekurangan C4.5
'. ,er%adi o-erlapping terutama ketika kelaskelasdan kriteria yang digunakan %umlahnya sangatbanyak
(. /engakumulasian %umlah kesalahan dari setiaptingkat dalam sebuah pohon keputusan yang
*. &esulitan dalam mendesain pohon keputusanyang optimal
4. asil kualitas keputusan yang didapatkan darimetode pohon keputusan sangat tergantungpada bagaimana pohon tersebut didesain
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
6/20
,ahapan Algoritma
'. Memilih atributsebagai akar
(. Membuat #abanguntuk tiaptiap nilai
didalam akar tersebut
*. Membagi atributdalam #abang.
4. 0langi proses untuk
setiap #abang sampaisemua atribut pada#abang memiliki kelasyang sama.
'.'1utlook
2es
igh 3ormal
2es31
'.'.(indy
unny Cloudy
"ainy
'umidity
3o 2es
,rue +alse
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
7/20
Contoh:&eputusan Bermain6ol7
!""#$%""
K$&M'&(A$
#(&)#M*+*$
W*!+ '%A
' unny ot igh +A89 3o
( unny ot igh ,"09 3o
* Cloudy ot igh +A89 2es
4 "ainy Mild igh +A89 2es
5 "ainy Cool 3ormal +A89 2es
"ainy Cool 3ormal ,"09 2es
; Cloudy Cool 3ormal ,"09 2es
< unny Mild igh +A89 3o
= unny Cool 3ormal +A89 2es
'> "ainy Mild 3ormal +A89 2es
'' unny Mild 3ormal ,"09 2es
'( Cloudy Mild igh ,"09 2es
'* Cloudy ot 3ormal +A89 2es
'4 "ainy Mild igh ,"09 3o
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
8/20
Atribut dan 8abel
- Atributatributnya adalah 1utlook?,emperature? umidity? dan ind
- edangkan 8abelnya ada padakolom /lay
- Dataset tersebut memiliki '4 kasusyang terdiri = !2es dan 5 !3o padakolom /lay
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
9/20
Calon #abang pohon keputusan
' 1utlook unny 1utlook Cloudy 1utlook "ainy( ,emperatur
ot,emperatureMild ,emperature Cool
*
umidity ighumidity3ormal
4 indy +alse indy ,rue
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
10/20
'. Memilih Atribut ebagaiAkar
Untuk memilih atribut sebagai akar, didasarkan pada nilai gain tertinggi dari
atribut-atribut yang ada. Untuk menghitung gain digunakan rumus seperti
tertera dalam Rumus 1
S : Himpunan kasus
A : Atribut
n : Jumlah atribut A
lSil: Jumlah kasus pada partisi ke i
lSl : Jumlah kasus dalam S
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
11/20
3ilai 9ntropi
penghitungan nilai entropi dapatdilihat pada persamaan :
: adalah himpunan $dataset) kasus
n: adalah banyaknya partisi
pi: adalah probabilitas yang di dapatdari um$2es) dibagi ,otal &asus
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
12/20
3ilai 9ntropy
Menghitung 7rek@ensi hasil play yangmun#ul berikut proporsinya sertaentropynya.
)a-il re/ pi %og2pi pi.log2pi
e- '> >.;' >.4= >.*5
!o 4 >.(= '.
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
13/20
Menghitung 6ain
Menghitung 6ain dari masing masing kriteriauntuk men#ari gain tertinggi yang akan di%adikan#abang keputusan.
2es 3o /$2es)/$3o
)/$2es) . 816(
/$2es)/$3o) . 816( /$3o) ,otal
p$outlook...)
,otal.p$outlook...)
$,otal.p$outlook...))gain
1utlook unny ( * >.4> >.> >.5* >.44 >.=; >.* >.*5 >.>>.(
Cloud
y4 > '.>> >.>> >.>> >.>> >.>> >.(= >.>>
"ainy 4 ' >. >.(> >.( >.4 >.;( >.* >.(
,emperature
ot ( ( >.5> >.5> >.5> >.5> '.>> >.(= >.(= >..'.; >.** >.*= >.5* >.=( >.4* >.*=
Cool 4 > '.>> >.>> >.>> >.>> >.>> >.(= >.>>
umidity igh * 4 >.4* >.5; >.5( >.4 >.== >.5> >.4= >.4=>.*;
3ormal
; > '.>> >.>> >.>> >.>> >.>> >.5> >.>>
indy +A89 ( >.;5 >.(5 >.*' >.5> >.
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
14/20
(. Membuat Cabang 0ntuk ,iaptiap3ilai Didalam Akar ,ersebut
Atribut dengan gain tertinggi adalahumidity yaitu sebesar >?*;.
'
umidity
'.' 2es
igh 3ormal
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
15/20
*. Membagi &asus Dalam Cabang
3ilai atribut umidity3ormal
sudah mengklasifkasikan kasus
men%adi ' yaitu 2es $2es;? 3o>) 3ilai atribut umidity igh
masih perlu dilakukan
perhitungan lagi
'
umidity
'.' 2es
igh 3ormal
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
16/20
3ode '.' e- !o 'e-5 '!o5 'e-5 X %"62'e-5'!o5 X %"62
'!o5$otal
&ntrop
poutloo/...5
$otal.poutloo/...5
$otal.poutloo/...55
gain
umidity igh * 4 >.4* >.5; >.5( >.4 >.== >.>>
outlookunn
y> * >.>> '.>> >.>> >.>> >.>> >.4* >.>> >.(= >.;>
Cloudy
( > '.>> >.>> >.>> >.>> >.>> >.(= >.>>
"ainy
' ' >.5> >.5> >.5> >.5> '.>> >.(= >.(=
,emperature ot ' ( >.** >.; >.5* >.*= >.=( >.4* >.*= >.= >.>(
Mild ( ( >.5> >.5> >.5> >.5> '.>> >.5; >.5;
Cool > > >.>> >.>> >.>> >.>> >.>> >.>> >.>>
indy +A89
( ( >.5> >.5> >.5> >.5> '.>> >.5; >.5; >.= >.>(
,"09 ' ( >.** >.; >.5* >.*= >.=( >.4* >.*=
4. #langi pro-e- untu/ -etiap a9ang -ampai-emua atri9ut pada a9ang memili/i /ela-ang -ama.
/enghitungan 9ntropy 3ode'.'
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
17/20
/ohon &eputusan 3ode '.'
Atribut dengan gain tertinggi adalah 1utlookyaitu sebesar >?;>
3ilai atribut 1utlookunny sudah meng
klasifkasikan atribut men%adi 'yaitu 3o $2es> 3o*)
Demikian pula pada atribut
1utlookCloudy? yaitu 2es
$2es( 3o>)
3ilai Atribut 1utlook"ainy
Masih perlu dilakukan perhitungan lagi
'umidi
ty
'.'1utloo
k
2es
igh3ormal
2es31
'.'.(
unny Cloudy"ainy
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
18/20
/enghitungan 9ntropy 3ode'.'.(
2es 3o /$2es) /$3o)/$2es) . 816(
/$2es)/$3o) . 816(
/$3o),otal
9ntropyp$outlook...)
,otal.p$outlook...)
$,otal.p$outlook...)) gain
umidity ighdan 1utlook
"ainy' ' >.5> >.5> >.5> >.5> '.>>
,emperature
ot > > >.>> >.>> >.>> >.>> >.>> >.>> >.>> '.>> >.>>
Mild ' ' >.5> >.5> >.5> >.5> '.>> '.>> '.>>
Cool > > >.>> >.>> >.>> >.>> >.>> >.>> >.>>
indy +A89 ' > '.>> >.>> >.>> >.>> >.>> >.5> >.>> >.>> '.>>
,"09 > ' >.>> '.>> >.>> >.>> >.>> >.5> >.>>
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
19/20
/ohon &eputusan 3ode'.'.(
Atribut dengan gain tertinggi adalah
indy yaitu sebesar '
3ilai atribut indy,rue
sudah mengklasifkasikan
kasus men%adi '
yaitu 3o $2es> 3o')
Demikian pula pada atributindy+alse? yaitu
2es $2es' 3o>)
'umidi
ty
'.'1utloo
k
2es
igh 3ormal
2es31
'.'.(indy
unny Cloudy"ainy
3o 2es
,rue +alse
-
7/25/2019 Habib Firdausi-Algoritma c4.5.pptx
20/20
/ohon &eputusan ,erakhir
"utput (ule5
"'. 7 umidity 3ormal then /lay 2es
"(. 7 umidity igh and 1utlook Cloudy
then /lay 2es"*. 7 umidity igh and 1utlook unny
then /lay 3o
"4. 7 umidity igh and 1utlook "ainy
and indy ,rue then /lay 3o"5. 7 umidity igh and 1utlook "ainy
and indy +alse then /lay 2es
'.'1utloo
k
2es
igh 3ormal
2es31
'.'.(indy
unny Cloudy"ainy
'umidi
ty
3o 2es
,rue +alse
top related