11 persiapan analisis data

12
P ersiapan Analisi s Data  Arman Endika Pu tra, SKM., MK es

Upload: arman

Post on 21-Feb-2018

219 views

Category:

Documents


0 download

TRANSCRIPT

Page 1: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 1/12

Persiapan Analisis Data Arman Endika Putra, SKM., MKes

Page 2: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 2/12

•  Apa Tujuan melakukan uji di awal data•  Selalu dilakukan uji awal yang bertujuan untuk memastikan bahwa

 berbagai analisa data bisa digunakan pada data tertentu. Dengan demikianhasil proses analisa data bisa diinterpretasi dengan tepat.

•  Bagaimana jika Data yang akan diproses tidak dilakukan pengujian terlebih dahulu? 

• Pengabaian Uji Data bisa berakibat biasna kesimpulan ang diambil, atau bahkan metode analisa tidak bisa diproses. Seperti jika Data !ang terdiri

dari banak "ariabel# mempunai banak missing value (data yang hilangatau tidak ada isina#. $ika data tersebut dipaksa untuk tetap diproses,maka output ang dihasilkan bisa sangat berbeda dibandingkan jika datatidak ada ang hilang !missing#. Pada beberapa jenis data ang sangat banak mengandung missing "alue, proses analisa bahkan tidak bisadilakukan.

•  Apa kendala yang dihadapi saat melakukan Uji Data?• Kendala ang dihadapi adalah banakna waktu dan tenaga ang terbuang

untuk melakukan proses Uji Data, ang bisa dianggap sebuah pemborosan.Sementara di lain sisi, jika memang Data ternata tidak laak untukdiproses lebih lanjut, tidak ada jaminan adana proses %pengobatan%!remedies# terhadap data tersebut hingga menjadi laak digunakan.

Page 3: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 3/12

•  Ada berapa macam Uji Data? 

• Uji Data bisa dilakukan dengan empat &ara'( Pengujian dengan menggunakan )ra*ik, seperti untuk

menguji bentuk kenormalan sebuah distribusi data,menguji sebaran dua "ariabel untuk korelasi dansebagaina.

( Pengujian adana Missing Data, akni menguji apakah data ang tidak lengkap atau ada data ang hilang akanmempengaruhi data se&ara keseluruhan.

( Pengujian adana +utlier !data ang sangat ekstrim#, angmungkin keberadaan data +utlier akan mengganggukeseluruhan data.

( Pengujian beberapa asumsi metodemetode Analisa, sepertiUji -ormalitas Data, Uji inieritas dan sebagaina.

Page 4: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 4/12

UJI DATA MISSING VALUE ANALYSIS

• Missing Data atau Missing /alue adalah in*ormasi ang tidaktersedia untuk sebuah subek !kasus#. Dalam terminologi SPSS,missing data adalah adana selsel kosong pada satu atau beberapa

 "ariabel.• Missing Data terjadi karena in*ormasi untuk sesuatu tentang obek

tidak diberikan, sulit di&ari atau memang in*ormasi tersebut tidakada. Sebagai &ontoh, pada Data )aji 0esponden atau Usia0esponden, bisa saja ada 0esponden ang karena alasan pribaditidak mau menebutkan )aji ataupun Usiana. 1al ini berakibat

adana data ang kosong pada kolom )aji atau Usia.• Pada dasarna tidak bermasalah bagi keseluruhan data, apalagi jika jumlahna hana sedikit, misal hana sekitar 23 dari seluruh data.-amun jika persentase data ang hilang tersebut &ukup besar, makaperlu dilakukan pengujian apakah data ang mengandung banakmissing tersebut masih laak diproses lebih lanjut ataukah tidak.

Page 5: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 5/12

• Pertama dilakukan adalah pengujian kerandoman Missing Data ang ada

• $ika missing "alue terbukti random, dalam arti missing "alue ang terjaditidak disengaja dan tidak menga&u keadaaan tertentu !misal missing hanapada "ariabel usia#, maka berbagai perlakuan !treatment# bisa dilakukanpada datadata ang missing.

• Penanganan terhadap Missing /alue bisa ber"ariasi, seperti membuang baris !kasus# ang mengandung missing "alue, menghapus "ariabel !kolom#

 ang mengandung missing "alue, dan sebagaina.

• Salah satu &ara ang populer adalah bukan menghilangkan baris ataukolom ang mengandung data missing, namun justru mengisi sel (data)yang missing dengan nilai tertentu yang dianggap bisa mendekatikenyataan sebenarnya jika data terisi.

•  Hal ini lebih baik dan rasional daripada membuang satu baris !datakonsumen# hana karena usia konsumen tidak terdata, atau bahkan satu "ariabel hana karena satu dua sel tidak terisi. 4ara mengisi data angmissing bisa berma&amma&am, dan ang populer adalah mengisi denganrata-rata keseluruhan data. Sebagai contoh, jika akan mengisi data usia ang hilang, maka &ari ratarata usia konsumen se&ara keseluruhan,

kemudian mengisi setiap data missing dari "ariabel usia dengan angka ratarata tersebut.

Page 6: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 6/12

UJI DATA OUTLIER 

• Data +utlier adalah data ang se&ara nata berbeda dengan datadata ang lain.&ontoh, data 255 tinggi badan orang di Asia, ternata ada data

dengan tinggi badan 625 &entimeter. 7inggi badan tersebut jelas bersi*at %ekstrim% dibanding ratarata tinggi badan orang asia padaumumna, misal sekitar 285 &entimeter. Data 625 &entimeter inilah

 ang disebut data outlier.• Data +utlier bisa terjadi karena beberapa sebab'

( Kesalahan dalam pemasukan data. 7erkait dengan &ontoh diatas, ternata

data ang seharusna 295 &entimeter diinput 625 &entimeter.( Kesalahan pada pengambilan sampel. 7erkait dengan &ontoh diatas,mereka ang diambil sampel 7inggi :adan adalah para pemain :asketpro*esional, ang memang tinggi badan mereka diatas ratarata.

( Memang ada datadata ekstrim ang tidak bisa dihindarkankeberadaanna.

• 7erkait dengan &ontoh diatas, atau memang ada banak orang Asia

 ang benar-benar mempunyai Tinggi adan !"# centimeter.

Page 7: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 7/12

Uji terhadap keberadaan Outlier• Uji terhadap keberadaan +utlier bisa dilakukan dengan dua &ara, akni

membuat nilai ; !standarisasi data#, menampilkan gra*ik data dalam bentuk Scatter $lot serta penyajian o% $lot.

• STANDARISASI DATA; Deteksi Data dengan standarisasi padaprinsipna mengubah nilai data semula menjadi dalam bentuk ;, dankemudian mena*sir nilai ; tersebut. 

• SCATTER PLOT DATA Diagram pen&ar !s&atter plot# menampilkansebaran data dari dua "ariabel, dan se&ara "isual akan bisa dideteksi dataoutlier, aitu data ang terletak jauh dari kelompok data. Karena s&atter

plot hana menampilkan dua "ariabel dalam satu gra*ik, maka jika adaenam "ariabel seperti kasus diatas, kombinasi s&atter plot akan menjadi banak. 1al inilah ang menebabkan pengujian dengan standarisasi !nilai;# lebih populer digunakan, sedangkan s&atter plot lebih sebagai pelengkap, ang menunjukkan data outlier se&ara "isual.

• BOX PLOT; 4ara ketiga untuk mendeteksi adana outlier adalah denganmembuat sebuah :o< Plot untuk sebuah "ariabel tertentu,

Page 8: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 8/12

PENANGANAN DATA OUTLIER 

• Setelah diketahui pada sebuah *ile terdapat satu atau lebih data outlier, kepada data outliertersebut bisa dilakukan beberapa penanganan'

• Data Outlier dihilangkan, karena dianggap tidak men&erminkan sebaran data angsesungguhna. Atau mungkin data outlier tersebut didapat karena kesalahan pengambilandata, kesalahan inputing pada komputer dan sebagaina. $ika hal ini dilakukan, makasebagai &ontoh konsumen dengan in&ome 2555 akan dihilangkan, sehingga jumlahkonsumen berkurang satu. Atau pada uji :o<Plot, berat badan 265 kilogram bisa sajadibuang dari data.

• Data Outlier tetap dipertahankan (reteni!, dan tidak perlu dihilangkan. 1al ini bisa disebabkan memang ada data outlier seperti itu, atau mungkin ada konsumen ang berpenghasilan 0p.2.555.555, ke atas. Atau tidak bisa dikatakan ada kesalahan padaproses sampling maupun inputing data. $ika ini dilakukan, maka sebagai &ontoh in&ome

2555 tetap ada di *ile, dan tidak perlu dihapus. Atau pada kasus :o<Plot, walaupun data265 adalah ekstrim, namun berat 265 kilogram tersebut tetap dipertahankan pada data.

• "eputuan untuk #enghilangkan atau #e#pertahankan e$uah data %utliertentu tergantung kepada pengguna, dengan alaan #aing&#aing'

Page 9: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 9/12

UJI DATA HOMOSKEDASTISITAS

• Uji 1omoskedastisitas pada prinsipna inginmenguji apakah sebuah grup !data kategori#

mempunai "arians ang sama diantara anggotagrup tersebut.

• $ika "arians sama, dan ini ang seharusna terjadi,maka dikatakan ada 1omoskedastisitas. Sedangkan

 jika "arians tidak sama, dikatakan terjadi1eteroskedastisitas.•  Alat untuk menguji 1omoskedastisitas bisa dibagi

dua, akni dengan alat analisis e"ene 7est, ataudengan Analisis 0esidual ang berupa gra*ik.

Page 10: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 10/12

UJI DATA NORMALITAS

• 7ujuan dari Uji -ormalitas adalah ingin mengetahui apakahdistribusi sebuah data mengikuti atau mendekati distribusinormal, akni distribusi data dengan bentuk lon&eng !bellshaped#. Data ang %baik% adalah data ang mempunai polaseperti distribusi normal, akni distribusi data tersebut tidakmen&eng kekiri atau men&eng kekanan.

• Uji normalitas pada multi"ariat sebenarna sangat kompleks,karena harus dilakukan pada seluruh "ariabel se&ara bersamasama.

• -amun uji ini bisa juga dilakukan pada setiap "ariabel,dengan logika bahwa jika secara individual masing-masingvariabel memenuhi aasumsi normalitas, maka se&ara bersamasama !multi"ariat# "ariabel"ariabel tersebut juga bisa dianggap memenuhi asumsi normalitas.

Page 11: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 11/12

UJI DATA LINIERITAS• inieritas adalah keadaan dimana hubungan antara "ariabel dependen

dengan "ariabel independen bersi*at linier !garis lurus# dalam range "ariabel independen tertentu.%nt%h, )u$ungan antara "eepatan Lari ee%rang (*aria$eldependen! +ang tergantung pada ia %rang tere$ut (*aria$el

 $e$a atau independen!'Maka se&ara umum dikatakan bahwa makin tinggi usia seseorang maka lariorang tersebut &enderung semakin &epat, ang jika direpresentasikan padagra*ik, maka terdapat garis ke kanan atas.-amun sebenarna hal itu benar hana pada range usia tertentu, misalantara 2= tahun sampai >5 tahun. Diatas >5 tahun mungkin ke&epatan lari

seseorang berbanding terbalik dengan usiana, akni makin tinggi usiaorang tersebut, makin lambat larina.

• inieritas bisa diuji dengan menggunakan scatter plot (diagram pencar)seperti ang digunakan untuk deteksi data outlier, dengan memberitambahan garis regresi. Karena s&atter plot hana menampilkan hubungandua "ariabel saja, maka jika terdapat lebih dari dua data, maka pengujian

dilakukan dengan berpasangan tiap dua data.

Page 12: 11 Persiapan Analisis Data

7/24/2019 11 Persiapan Analisis Data

http://slidepdf.com/reader/full/11-persiapan-analisis-data 12/12

SEKIAN7erima Kasih