31 Januari 2021

Langkah Analisis Diskriminan Dengan SPSS

Analisis Diskriminan merupakan metode untuk menentukan skor komposit dari variabel-variabel yang dihitung dan melekat pada anggota sampel. Yang mana dari hasil skor komposit ini,  kemudian dapat dikelompokkan tiap anggota sampel ke dalam grup/kelompok tertentu. 

Contoh Kasus

Sebuah tempat pariwisata, yang banyak dikunjungi wisatawan akan melakukan survei pada para pengunjung. Variabel penelitian antara lain informasi tempat wisata, sikap/persepsi, jumlah keluarga, umur kepala keluarga dan pendapatan responden. Informasi tempat wisata dibagi menjadi 2 kelompok yaitu kelompok 1 yang mendapatkan informasi dari promosi dan kelompok ke 2 yang tidak mendapatkan informasi promosi. Pihak manjemen ingin mengetahui faktor-faktor apa yang mempengaruhi pada masing-masing kelompok? dan apakah ada perbedaan yang signfikan antara kelompok 1 dan kelompok 2? Data yang diperoleh sebagai berikut:

Keterangan :

  1. Informasi : 1 = Mendapatkan promosi, 0= tidak ada promosi
  2. Sikap : Skala 1-5 (tidak baik- sangat baik)
  3. Jumlah anggota keluarga
  4. Umur Kepala Keluarga
  5. Pendapatan keluarga

Langkah-langkah analisis dengan SPSS

  1. Pilih Analyze >Classify >Discriminant
  2. Pindahkan variabe Informasi ke kolom Grouping Varibael, Klik Define Range. Masukan angka 0 ke kotak minum dan 1 ke kotak maximum.
  3. Pindahkan variabel sikap, jumlah keluarga, umur KK, dan pendapatan ke kolom independent
  4. Pilih Statistics dan pilih Univariate's Anova dan Box's M kemudian Continue
  5. Klik OK

Hasil Output Analisis Diskriminan

Tabel group statistics menerangkan bahwa kasus yang dianalisis ada 30 responden. Ada 15 responden yang mendapatkan informasi promosi dan 15 responden lainnya tidak mendapatkan informasi promosi.
 

Tabel test of equality of group means di atas adalah hasil analisis untuk menguji kesamaan rata-rata variabel. Uji ini menggunakan wilk's lambda dan nilai signifikansi. Jika angka wilk's lambda mendekati angka 0 maka cenderung ada perbedaan dalam kelompok. Kriteria nilai signifikansi jika nilai signifikansi > 0.05 maka ada perbedaan dalam kelompok. 

Untuk variabel Sikap nilai wilk's lambda 0.978 dengan signifikansi 0.435, karena nilai signifikansi 0.435 > 0.05 maka kesimpulan tidak ada perbedaan untuk sikap dalam kelompok. Demikian juga untuk Umur KK memiliki nilai signifikansi 0.257 > 0.05 artinya tidak ada perbedaan dalam kelompok. Hanya variabel Jumlah keluarga dan Pendapatan yang memiliki perbedaan dalam kelompok tersebut karena nilai signifikansi < 0.05. Dengan demikian jumlah keluarga dan pendapatan merupakan faktor pembeda dalam mencari informasi promosi wisata. Artinya bahwa jumlah keluarga yang sedikit dan banyak akan mempengaruhi kelompok untuk mencari informasi promosi wisata. demikian juga halnya dengan variabel pendapatan yang kecil dan besar akan mempengaruhi kelompok dalam mencari informasi wisata.

Untuk menguji kesamaan varian digunakan angka Box's M dengan ketentuan jika nilai signifikansi > 0.05 maka H0 diterima yang artinya bahwa kedua kelompok data adalah identik/homogen. Dari tabel Box's M diketahui bahwa nilai yang didapat sebesar 16,133 dengan signifkansi sebesar 0.192. Karena nilai signifikansi 0.192 > 0.05 maka terima H0 yang artinya bahwa kedua kelompok data adalah homogen.

NB. Jika tidak terpenuhi asumsi ini dapat dilakukan eksplorasi data untuk melihat kemungkinan ada tidaknya outlier data.

Pada tabel eigenvalues terdapat nilai canonical correlation. Nilai canonical correlation digunakan untuk mengukur derajat hubungan antara hasil diskriminan atau besarnya variabilitas yang mampu diterangkan oleh variabel independen terhadap variabel dependennya.

Diketahui bahwa nilai caninical correlation sebesar 0.795 jika dikuadratkan menjadi (0.795 x 0.795) = 0.632, artinya bahwa 63.2% varians dari variabel independen (kelompok) dapat dijelaskan oleh model diskriminan yang terbentuk.

Pada tabel wilk's lambda diketahui memperoleh nilai 0.368,  chi-square 26.013 dan signifikansi sebesar 0.000 lebih kecil dari 0.05 yang artinya bahwa ada perbedaan yang signifikan antara kedua kelompok responden yang didasarkan pada keempat variabel bebas.

Tabel structure matrix menunjukkan urutan karakteristik yang paling membedakan perilaku dua kelompok wisatawan, dapat dilihat pada nilai function. Karakteristik pendapatan paling tinggi perbedaannya kemudian jumlah keluarga, umur KK dan terakhir ada Sikap.

Berdasarkan angka tabel di atas, terdapat dua kelompok yang berbeda yaitu kelompok tidak ada promosi dengan centroid (rata-rata kelompok) negatif dan kelompok promosi dengan centorid (rata-rata kelompok) positif.

Setelah mengetahui hasil analisis diskriminan di atas, selanjutnya dilakukan pengujian signifikansi perbedaan antara dua kelompok  dan mencari faktor pembeda yang mempengaruhi terbentuknya klasifikasi dua kelompok tersebut.

Langkah analisis diskriminan dengan SPSS

  1. Pilih Analyze > Classify > Discriminant
  2. Pindahkan variabel informasi ke kolom Grouping variable
  3. Define range : isikan 0 pada minimum dan 1 pada maximum
  4. Pindahkan variabel sikap, jumlah keluarga, umur KK dan pendapatan ke kolom independent
  5. AKtifkan pilihan "use stepwise methode"
  6. Pilih statistics: Pada descriptives, pilih means dan functions coeficient pada pilihan Fishers's dan unstandardized, kemudian Continue.
  7. Pilih Methode : alktifkan pilihan Mahalanobis distance dan aktifkan pilihan use probability of F tanpa emngubah angka 0.05. Tekan Continue.
  8. Pada classify : aktifkan casewise result dan leave one out classification. Tekan Continue
  9. Tekan OK

Hasil output SPSS 

Tabel di atas berisi data statistik deskripsi, seperti rata-rata untuk variabel bebas yang digunakan untuk kelompok pertama dan kelompok kedua. Sebagai contoh pada kelompok yang memperoleh promosi, paada variabel sikap nilai rata-rata 4,00 sedangkan yang tidak memperoleh promosi sebesar 3,60. Artinya bahwa rata-rata sikap terhadap tempat wisata pada kelompok 1 lebih tinggi dibandingkan pada kelompok ke 2.

 
Pada tabel di atas dapat dilihat bahwa hanya terdapat variabel pendapatan dan jumlah keluarga, karena hanya dua variabel tersebut yang memenuhi persyaratan. Metode yang dilakukan menggunakan metode "stepwise", yaitu memasukkan variabel satu per satu tidak secara sekaligus seperti pada analisis sebelumnya. Variabel pendapatan, dipeoleh nilai F sebesar 33,796 dengan nilai p-value statistik 3,027E-6 (atau 0,00000303). sedangkan variabel jumlah keluarga diperoleh nilai F sebesar 21,616 dengan nilai p-value 2,484E-6 ( atau 0,000002484).
Pada tabel variable in analysis di bawah ini, menunjukkan kondisi urutan variabel-variabel yang dianalisis. Tahapan pemasukan variabel ditentukan oleh besar kecilnya angka signifikan of F to remove dimana nilai terkecil yang didahulukan. Variabel pendapatan mempunyai signifikansi sebesar 0.000, oleh karena itu variabel ini dimasukkan terlebih dahulu. Selanjutnya jumlah keluarga dengan nilai signifikansi 0,037.
 

Angka signifikansi untuk dua variabel sebesar 0.000 dengan nilai F sebesar 33.796 pada tahap 1 dan pada tahap 2 nilai signifikansi sebesar 0.000 dengan nilai F sebesar 21.616. Karena nilai signifikansi 0.000 < 0.05 maka variabel masing-masing kelompok mempunyai perbedaan yang signifikan.

Nilai korelasi kanonikal menunjukkan hubungan antara nilai diskriminan dengan kelompok. Nilai 0.785 berarti hubungan sangat tinggi karena mendekati angka 1 (besarnya korelasi antara 0 -1).

Tabel structure matrix menunjukkan adanya korelasi antara variabel-variabel bebas dengan fungsi diskriminan yang terbentuk. Variabel pendapatan mempunyai korelasi yang paling tinggi dengan nilai korelasi sebesar 0.868. Variabel jumlag keluarga nilai korelasi sebesar 0.571. Sedangkan umur KK -0,033 dan sikap 0,001 tidak dimasukkan dalam proses analisis diskriminan, karena kedua variabel tidak signifikan dibedakan antara kedua kelompok. Hal ini dapat diketahui dengan tanda "a" pada kedua variabel tersebut.

Tabel di atas menunjukkan fungsi diskriminan dengan persamaan sebagai berikut :

Zscore = -6,433 (konstan) + 0.454 (jumlah keluarga) + 0.00 pendapatan. Fungsi ini berguna untuk menganalisis kasus atau responden yang diteliti akan masuk ke kelompok mana yaitu kelompok pertama atau kelompok kedua.

Tabel function at group centroids di atas menerangkan bahwa terdapat dua kelompok diskriminan, yaitu kelompok yang tidak mendapatkan promosi dengan rata-rata kelompok (centroid) negatif dan kelompok yang memperoleh promosi dengan rata-rata kelompok (centroid) positif.

Pada tabel classification processing summary memberikan petunjuk bahwa dari 30 responden, semua data diproses semua, jadi tidak ada data responden yang hilang (missing).

Pada tabel prior probabilities for groups memberikan deskripsi bahwa kelompok yang tidak ada promosi sebanyak 15 responden sedangkan kelompok yang mendapatkan promosi sebanyak 15 responden.

Pada bagian ini sama seerti bagian canonical discriminat function coefficient di atas yang sudah dibahas. Persamaan yang terbentuk sebagai berikut :

  1. Untuk kelompok tidak ada promosi, Nilai = -14,404(konstan) + 1,952(jumlah keluarga) + 0.00005238(pendapatan).
  2. Untuk kelompok tidak ada promosi, Nilai = -30,132(konstan) + 3.062(jumlah keluarga) + 0.00007536(pendapatan).

Selisih antara kedua kelompok :

Nilai Z = 15,728 (kosntan) + 5,014 (jumlah keluarga) + 0,00012916 (pendapatan).

Tabel di atas pada kolom original baris " Tidak ada promosi" sebanyak 14 responden atau 93,3% sedangkan 1 responden atau 6,7% berpindah ke kelompok "Promosi". Sementara itu, 12 responden (80%) yang berada di kelompok "Promosi", sedangkan 3 responden (20%) berpindah ke kelompok yang " Tidak ada promosi". Sehingga ketepatan fungsi diskriminan dapat dihitung dengan cara : 14 + (12/30) = 0.866 atau 86.6%. 

Kesimpulan :

  1. Terdapat perbedaan yang signifikan antara kelompok responden yang memperoleh promosi wisata dengan kelompok responden yang tidak ada promosi wisata.
  2. Faktor-faktor yang membuat berbeda adalah variabel jumlah keluarga dan pendapatan.
  3. Ketepatan fungsi diskriminan adalah sebesar 86.6%. Ketepatan ini tinggi karena mendekati 100%.
  4. Persamaan fungsi diskriminan : 
          Nilai Z = 15,728(konstan) + 5,014(jumlah keluarga + 0.00012916(pendapatan)



Tidak ada komentar: