Tampilkan postingan dengan label SPSS. Tampilkan semua postingan
Tampilkan postingan dengan label SPSS. Tampilkan semua postingan

30 Januari 2021

Cara Analisis K-Mean Cluster

Analisis K-Mean Kluster bertujuan untuk mengelompokkan obyek berdasarkan ciri-ciri yang dimiliki atau karekateristik yang dimiliki. Pengelompokkan obyek ini bisa berdasarkan ciri-ciri pada responden atau produk dan entitas lainnya, sehingga obyek tersebut memiliki kemiripan yang sama dalam satu kluster. Hasil analisis kluster dari sebuah obyek akan memiliki kesamaan (homogenitas) yang tinggi dalam 1 kluster yang sama dan memiliki ketidaksamaan (heterogenitas) dengan kluster yang lain.

Contoh kasus 

Sebuah pusat pembelanjaan  melakukan riset untuk mengtahui apa saja yang mendorong konsumen/pembeli berbelanja di Swalayan tersebut. variabel-variabel pertanyaan yang diajukan ke konsumen yaitu : lokasi toko, harga produk, kebersihan, pelayanan kasir, fasilitas dan keindahan interior swalayan. Untuk itu setiap responden diberi 6 pertanyaan dan didapat 20 responden sebagai sampel. Data yang diperoleh sebagai berikut :

Data Input

Dari data tersebut pertama dilakukan nilai standarkan terlebih dahulu dengan membuat nilai z-score, dengan cara:

  1. Klik Analyze >Descriptive statistics > Descriptives
  2. Pindahkan variabel-variabel tersebut ke kolom variable (s)
  3. Aktifkan Save standardized values as variables
  4. Klik OK

 

Descriptive Statistics
 

Perhatikan  bahwa nilai deskriptif pada tabel di atas berguna dalam membantu pengelompokan kluster nantinya. Nilai mean/rata-rata penilaian responden terhadap faktor-faktor pada swalayan tertinggi pada faktor keindahan interior sebesar 4.35, kemudian harga produk dan pelayanan kasir masing-masing 4.10, kebersihan 3.95, lokasi toko 3.85 dan terendah pada fasilitas hanya 3.45.

Nilai Z score dari variabel

 

Hasil nilai z-score terlihat pada tabel dengan awalan Z, nilai ini yang nantinya sebagai data input yang akan dianalisis.

Kemudian langkah analisis K-Mean Cluster dalam SPSS:

  1. Pilih Analyze > Classify > K-Mean Cluster
  2. Pindahkan variabel z-core yang berawalan "z" ke kolom variable (s)
  3. Tentukan jumlah kluster dengan mengisikan angka 3 pada Number of Clusters
  4. Pilih Save dan aktifkan Cluster Membership dan distance from cluster centre, kemudian Continue
  5. Pilih Option, aktifkan Initial Cluster dan Anova Table
  6. Tekan OK.

 Hasil Ouput K-Mean Cluster dari SPSS

Initial Cluster Centers
 

Pada tabel Initial cluster Centers menunjukan hasil proses sementara pengelompokan data yang dilakukan. Karena proses ini baru awal maka perlu dilakukan proses selanjutnya.

Iteration History

Pada tabel Iteration history. metode K-Mean Cluster akan menguji dan realokasi kluster yang ada. Proses tersebut dinamakan iteration yang memuat perubahan pada initial cluster (change in cluster). Proses ini pengelompokan diulang dengan ketepatan yang lebih akurat.

Cluster Membership

Pada cluster mebership memberikan petunjuk bahwa tiap responden masuk ke dalam masing-masing cluster yang dibentuk. Seperti responden 1 masuk kluster 3, responden 2 masuk kluster 2 dan responden 4 masuk kluster 1. Namun pengelompokan ini masih tahap awal, perlu dianalisis lebih lanjut.

Final Cluster Centers

Tabel final clster centers menunjukan hasil analisisnya untuk masing-masing variabel dan kluster yang dibentuk. Pedoman untuk menafsirkan tabel hasil analisis dengan ketentuan sebagai berikut :

  1. Jika hasil perhitungan ditemukan hasil negatif berarti kluster yang bersangkutan ada di bawah rata-rata total.
  2. Jika hasil perhitungan ditemukan hasil positif berarti kluster yang bersangkutan ada di atas rata-rata total.

Contoh perhitungan untuk angka skor variabel lokasi toko pada kluster 1, 2 dan 3.

Dimana : 

X = rata-rata sampel/data/variabel dalam kluster tertentu 

= rata-rata populasi

= standard deviasi

 
Hitung Skor variabel pada tiap Kluster

Perhitungan manual di atas hanya sebagai gambaran/contoh, untuk variabel 1 (lokasi toko). Untuk variabel yang lain dapat dilakukan perhitungan sesuai dengan rumus di atas.

Penafsiran untuk variabel 1 (lokasi toko) adalah :

  1. Kluster 1 nilai rata-rata 3,50009 lebih kecil/rendah dari rata-rata populasi 3,85, hal ini berarti responden tidak menyukai lokasi swalayan.
  2. Kluster 2 nilai rata-rata 1,667175 lebih rendah dari rata-rata populasi 3,85, hal ini berarti responden tidak menyukai lokasi swalayan.
  3. Kluster 3 nilai rata-rata 5,7405481 lebih tinggi dari rata-rata populasi 3,85, hal ini berarti responden menyukai lokasi swalayan.

Namun secara cepat hasilnya dapat diketahui dari nilai tiap variabel (tanda - dan +) pada tabel final cluster centers. Dengan memperhatikan tanda tersebut dapat diketahui tiap variabel masuk ke dalam kluster mana?. Sesuai dengan pedoman penafsiran tabel analisis di atas. Variabel 1 (lokasi toko) masuk Kluster 3, variabel 2 (harga produk)  masuk Kluster 1, variabel 3 (kebersihan) masuk Kluster 4, variabel 4 (pelayanan kasir) masuk Kluster 1, variabel 5 (fasilitas) masuk Kluster 2 dan variabel 6 (keindahan interior)masuk Kluster 1.

Distance between Final Cluster Centers

Tabel Distances between final cluster centers menunjukkan jarak antar kluster, semakin besar nilai/angka maka semakin besar/lebar jarak antar kluster. Kluster 1 berjarak dengan kluster 2 sebesar 3,563 dan dengan kluster 3 sebesar 3,473. Jarak kluster 2 dengan kluster 1 sebesar 3,563 dan dengan kluster 3 sebesar 3,679. Jarak kluster 3 dengan kluster 1 sebesar 3,473 dan dengan kluster 2 sebesar 3,679. 

Uji F Anova

Sekarang kita akan menguji apakah masing-masing kluster berbeda secara signifikan. Pengujian dilakukan dengan melihat nilai F dan signifikansinya pada tabel Anova. Untuk mempermudah kita menggunakan p-value signifikansi. Pengujian hipotesisnya sebagai berikut :

H0 = Ketiga kluster tidak ada perbedaan yang signifikan

H1 = Ketiga kluster ada perbedaan yang signfikan

Tolak hipotesis nol (H0) jika nilai p-value <0.05 

Pada tabel Anova di atas menunjukan nilai p-value pada keenam variabel lokasi toko sebesar 0.000, harga produk 0.000, kebersihan 0.000, pelayanan kasir 0.000, fasilitas 0.000, fasilitas 0.000 dan keindahan interior sebesar 0.000. Sehingga dapat disimpulkan bahwa keenam variabel tersebut ada perbedaan yang signifikan karena nilai p-value yang didapat <0.05.

Number of Cases in each Cluster

Tabel Number of caes in each cluster, memberikan gambaran jumlah responden yang masuk ke dalam tiap-tiap kluster. Kluster 1 ada 6 responden, kluster 2 ada 6 responden dan kluster 3 ada 8 responden.

Hasil secara keseluruhan analisis k-mean cluster dapat dirangkum dalam bentuk tabel excel di bawah ini.

Rangkuman Hasil K-Mean Cluster

Baca juga :  

3. Langkah Analisis Korespondensi dengan SPSS 

Referensi :

Abony,J dan Feil,B. (2007). Cluster Analysis for Data Mining and System Identification.Boston Berlin: Birkhauser Verlag

Field,A. (2005). Discovering Statistics Using SPSS 2rd. London: Sage Publications

Hair,J.F,.Black,W.C.,Babin,B.J.,and Anderson,R.E. (2009). Multivariate Data Analysis 7th Edition.Prentice Hall

Kaufman,L and Rousseeuw,P.J. (2005). Finding Groups In data An Introduction to Cluster Analysis.New Jersey: John Wiley & Sons

Yamin,S dan Kurniawan,H. (2009). SPSS Complete :Teknik Analisis Statistik Terlengkap dengan Sofware SPSS.Jakarta : Salemba Infotek

30 November 2020

Regresi Partial Least Squares Regression (PLSR) di SPSS

Regresi Ordinary Least Squares (OLS) memiliki asumsi yang mendasarinya seperti tidak adanya multikolinieritas atau korelasi yang tinggi antara variabel independen, jumlah variabel independen juga tidak lebih besar dari observasinya. Dengan adanya multikolinieritas pada model regresi OLS maka model menjadi bias sebagai prediksi. Demikian untuk jumlah sampel yang lebih besar dari observasi maka degree of freedom (df) menjadi negatif sehingga regresi PLS tidak dapat menyelesaikan persamaan.


Untuk kasus seperti dalam ilmu kimia dan sebagainya yang mana memiliki jumlah variabel besar dan sampel observasi kecil diperlukan metode analisis Regresi Partial Least Squares. Metode ini diperkenalkan oleh ahli ekonometrik pertama kali oleh Herma Wold di tahun 1960 an.

"The PLS algorithm axtracts a latent factors (tehnically, components since principal components analysis is used) for the set of independent variables and for the set of dependent variables, such that explanation of the covariance between the two latent variables is maximized. Using multiple regression for scale variables, a classification algorithm for categorical variables, or a mixed model, the dependent variables or variables is predicted"

 " SPSS recomends PLS regression as particulary usefull when predictor variables are highly correlated or when the number of predictors excceds the number of case" (Garson, 2016).

 Di aplikasi IBM SPSS penambahan fitur Partial Least Squares (PLS) dimulai pada versi SPSS 16 ditahun 2017. Pada kesempatan kali ini saya memberikan cara untuk menginstal program regresi PLS di Aplikasi IBM SPSS 23. Ada beberapa program tambahan yang dibutuhkan untuk menginstal ke SPSS 23, antara lain :

  1. SPSS_STATSPYT_PLG-INTRL32B21.0WINML : download
  2. numpy-1.6.2-win32-superpack-python2.7 : Download https://www.scipy.org/
  3. scipy-0.10.0-win32-superpack-python2.7 : Download https://www.scipy.org/
  4. python-2.7.3 : download https://www.python.org/downloads/
  5. PLS dan Plscommand : download

NB. uNtuk versi SPSS yang lain bisa berbeda

Setelah selesai melakukan download program di atas, kemudian langkah instalasi program Regresi PLS di SPSS :

  1. Pastikan untuk program SPSS sudah terinstal di komputer/laptop.
  2. Instal program python 2.7.3 pada komputer
  3. Instal program scipy-0.10.0-win32-superpack-python2.7 di komputer
  4. Instal program  numpy-1.6.2-win32-superpack-python2.7 di komputer
  5. Instal program SPSS_STATSPYT_PLG-INTRL32B21.0WINML di komputer
  6. Copi file PLS  dan PLScommand ke dalam direktori program IBM SPSS 23, caranya : Program File --> IBM --> SPSS --> Statistics -->23 --> extentions.

Setelah selesai melakukan instalasi, kemudian buka di menu Analyze --> Regression --> Partial Least Squares. Jika muncul menu Partial Least Squares, maka proses instalasi sudah berhasil.

Langkah Analisis Regression Partial Least Squares
 

Selain dengan program aplikasi SPSS, ada beberapa aplikasi yang dapat digunakan untuk analisis Regression Partial Least Squares, antara lain :

  1. GENSTAT : software ini memiliki fitur yang cukup lengkap, termasuk regresi PLS. Link : www.vsni.co.uk/software/genstat
  2. The Scrumbler : Software berasal dari Camo.inc. Mampu mengimplementasikan PLS regression dan PLS-DA. PLS berdasarkan analisis diskriminan. Link   : www.camo.com/rt/Product/Unscrambler/unscrambler.html
  3. Morphoj : mendukung two block partial Least Squares. Link :  www.flywing.org.uk/MorphoJ_page.html
  4. tpsPLS : software ini dapat diperoleh secara gratis, juga  mendukung two block partial least squares. Link : http://tpspls.software.informer.com/
  5. XLSTAT-PLS : merupakan modul add-on untuk excel spreedsheet. Link :  www.xlstat.com/en/products-solutions/pls.html
  6. Stata : modul extention ini dinamakan dengan plssas. Link : www.bc.edu/RePEc/bocode/p
  7. Software S-Plus, Matlab dan aplikasi R

Baca juga :

1. Analisis Jalur

2. Regresi Berganda

3. Cara Mengatasi data tidak Normal

Referensi :   
Garson, David. G. (2016). Partial Least Squares : Regression & Structural Equation Model. North Carolina. Statistical Publishing Association.

Ghozali, I. (2013). Aplikasi Analisis Multivariate dengan Program IBM SPSS 21 Update PLS Regresi. Semarang : Badan Penerbit Universitas Diponegoro.

25 Oktober 2020

Tutorial Variabel Mediator atau Intervening Pada analisis Jalur (Path Analysis) dengan SPSS

 


Model analisis jalur (path analysis) merupakan model yang dikembangkan dari model regesi berganda. Dimana regresi berganda hanya menguji hubungan pengaruh langsung dari variabel independen terhadap variabel dependennya. Namun dalam model dimana variabel indepeden selain memiliki pengaruh langsung ke variabel dependen, juga membutuhkan sebuah variabel lain dalam mempengaruhnya yang mana variabel tersebut sebagai variabel antara yang dinamakan variabel mediator atau intervening. Misal untuk hubungan pengaruh dari Dept to equity ratio (DER) terhadap Return On Equity (ROE) dan apakah hubungan pengaruh DER ke ROE melewati variabel Agency cost. Variabel agency cost tersebut sebagai variabel mediasi atau intervening. Model hubungan tersebut dapat digambarkan pada model di bawah ini. 

Konsep Model Mediator

Untuk menguji model dengan variabel mediator atau intervening dapat menggunakan Sobel Tes.  Uji sobel tes pada artikel sebelumnya dilakukan secara manual menggunakan rumus kalkulator uji sobel tes yang telah disediakan oleh beberapa website seperti danielsoper dan quanpsy. Pengujian sobel tes menghendaki asumsi jumlah sampel besar dan nilai koefisien mediasi berdistribusi normal. Meskipun asumsi ini telah banyak dikritik oleh para ahli seperti pada kasus dengan jumlah kecil yang pada umumnya tidak normal. Koefisien mediasi merupkan perkalian koefisien dua (2) variabel yang akan cenderung tidak normal dan akan menghasilkan distribusi menceng positif (positively skewned) sehingga mengahsilkan unpower tes mediasi. Oleh karena hal tersebut untuk signifikansi mediasi dengan pendekatan bootstraping, dimana pendekatan ini merupakan nonparametrik yang tentunya tidak mengasumsikan distribusi normal dan dapat dilakukan pada jumlah sampel kecil. Untuk kesempatan kali ini saya memperkenalkan uji sobel tes yang dapat dilakukan dengan software SPSS, dimana output pengujian sudah langsung bisa diketahui nilai koefisien  dan nilai signifikansi dari variabel mediasi. Preacher dan andrew F. Hayes (2004) telah membuat scrip untuk uji sobel tes ini, dimana script ini dapat diinstal pada sofware SPSS. Script sobel tes dapat didownload afhayes. Setelah berhasil didownload ada 2 langkah atau cara melakukannya :

  1. Untuk script (sobel.sbs), cara ini script tidak terinstal permanen di SPSS. Langkah buka dahulu SPSS, kemudian pilih File --> Open --> Script --> pilih sobel.sbs. Kemudian klik run macro atau start/resume (*data sudah ter-input di data editor).
  2. Untuk file (sobel.spd), dapat diinstal permanen di SPSS. Langkah buka SPSS, pilih ke menu Extentions --> Utilities --> Instal Custom Dialog (compatible mode). Kemudian pilih file sobel.spd, Klik OPEN.

Langkah analisis Sobel tes menggunakan SPSS 

Buka data di SPSS data editor. Kemudian Analyze -->Regresion --> Preacher and Hayes (2004) Simple Mediation Procedure (Sobel)

Langkah Analisis Mediator dengan Sobel test

Kita masuk ke menu uji sobel tes. Masukkan variabel ROE ke Dependent variabel (Y), variabel agency cost ke Proposed mediator (M) dan ROE ke independen variable (X).

Menu Simple Mediation Procedure

Pilih Bootstrap sampel sebesar : 1000, dan centang : show effect sizes, klik OK

Menu Sobel tes

Hasil pengujian pada tabel dibawah menunjukkan bahwa DER variabel independen (X), ROE sebagai variabel dependen (Y) dan Agency Cost sebagai mediator (M). Nilai koefisien korelasi pearson antara variabel ROE dengan DER sebesar 0.6095, ROE dengan Agency cost sebesar 0.7298, DER  dengan Agency Cost sebesar 0.6061.

Output Sobel Test dengan SPSS

 

Untuk hasil direct effect dan total effect, nilai b (YX) adalah total effect variabel DER (X) terhadap variabel ROE (Y) dengan nilai koefisien sebesar 0.1281 dan signifikansi 0.000. Nilai b (MX) adalah pengaruh variabel mediator Agency Cost (M) terhadap variabel ROE (Y), nilai koefisien yang diperoleh sebesar 0.1564 dengan signifikansi 0.000. Nilai b (YM.X) adalh nilai pengaruh variabel agency cost (M) terhadap ROE (Y) dengan mengontrol variabel independen DER (X), nila koefisien sebesar 0.4376 dengan signifikansi 0.000. Nilai b (YX.M) adalah pengaruh variabel independen DER (X) terhadap variabel ROE (Y) dengan mengontrol variabel Agency cost (M), nilai koefisien yang diperoleh sebesar 0.0534 dengan signifikansi 0.0290

Hasil indirect effect dari bootstraping yang tidak mengasumsikan distribusi normal dan sampel yang digunakan juga kecil, menghasilkan nilai koefisien sebesar 0.0684 dengan standar eror 0.0201, nilai eror ini lebih besar dibandingkan dengan standar eror pada pengujian dengan asumsi distribusi normal yakni 0.0196. Sehingga dengan pengujian bootstraping, diperoleh nilai z-hitung adalah 0.0684/0.0201 = 3.403. Hasil ini lebih kecil dari nilai z-hitung dengan pengujian dengan asumsi distribusi normal yakni 3.4975 dan lebih tinggi dari nilai z-tabel 1.96 (taraf signifikansi 5%). Maka jelas dapat disimpulkan bahwa Agency cost signifikan mampu menjadi mediasi hubungan pengaruh variabel DER terhadap ROE.

Baca juga :  

1. Uji Mediasi dengan Sobel Tes

2. Peranan Mediator dalam Model PLS

3. Model Moderator dengan Uji Residual

Referensi :

Hayes, A.F dan Preacher, J.F.(2004). SPSS and SAS Procedures for Estimating Indrect Effects in Simple Mediation Models. Behavior Research Methods, Instruments and Computer.36. 717-731

McKinnon, D.P. (2008). Introduction to Statistical Mediation Analysis. New York. Lawrence Erlbaum Associates 

Hayes. A. F. (2018). Introduction Mediation, Moderation, and Conditional Process Analysis 2nd :  A Regression-Based Approach. New York. Guilford Press