MENGHITUNG NILAI CHI SQUARE DALAM MODEL SEM

Telah diposting materi tentang konsep menguji kecocokan model yang mendasari uji chi square, yakni membandingkan sample covariance dan implied covariance.  Pada materi kali ini, akan diperkenalkan bagaimana perhitungan nilai chi square didapatkan. Sebagian besar perhitungan menggunakan operasi matrik dan sebagian dari teknis menghitung di excel sudah dijelaskan pada materi yang lalu.

Slide1

Gambar 1 memodelkan hubungan dua variabel laten yang masing-masing memiliki tiga indikator (observable variable) dan jumlah sampel = 73 serta hasil perhitungan matrik kovarian dari data (S) dan matrik kovarian dari model (sigma)

Berikut ini adalah rumus yang digunakan untuk menghitung chi square berdasarkan estimasi maximum likelihood. Parameter yang digunakan untuk menghitung adalah matrik kovarian dari data (S), matrik kovarian dari model atau implied covariance (Sigma) dan jumlah total observable variabel (p). Di dalamnya ada perhitungan nilai invers matrik untuk implied covariance dan nilai determinan baik pada matrik kovarian dari data maupun implied covariance.

ChiSquare = (n-1) FML

FML = tr(S*invers sigma) – p + Ln |sigma| – Ln |S|

Slide2

 

 

 

Slide3Perhitungan nilai determinan matrik S dan sigma bisa dihitung seperti pada materi operasi matrik dalam excel. Simbol tr(S*invers sigma) mempunyai maksud menghitung hasil penjumlah pada elemen diagonal dari matriks tersebut. Pada Gambar 3, didapatkan tr(S*invers sigma) = 6, p = 6, Ln |sigma| = 18.464 dan Ln |S| = 18.355.

Maka hasil FML adalah 6 – 6 + 18.464 – 18.355 = 0.109

Sehingga chi square adalah : (73-1)(0.109) = 7.851, hasil ini mirip dengan perhitungan AMOS sebesar 7.853. Perbedaan angka ini terjadi karena proses pembulatan yang berbeda.

Pada sebab inilah, pemodelan dengan jumlah sampel yang terlalu besar (beberapa referensi menyebut lebih dari 200 sampel, maka sensitifitas nilai chi square menjadi menurun. Artinya, sebenarnya ada kemiripan hasil matrik kovarian dari data dan model akan tetapi harga chi square menjadi lebih tinggi karena dikalikan dengan ukuran sampel yang lebih besar.

Selamat mencoba. Semoga bermanfaat. Informasi dan permintaan training bisa menghubungi pak Khasanuddin di 0817.048.77.26

Materi serupa bisa diakses pada https://www.facebook.com/stcmalang

Referensi :

Schumacker, R.E. dan Lomax R.G. 2004. A Beginner’s Guide to Structural Equation Modeling. Edisi Kedua. Lawrence Erlbaum Associates Publisher. Hal. 101 (Link ebook : – )

Posted in MODEL SEM | Tagged , , , , , | Leave a comment

OPERASI MATRIK MENGGUNAKAN EXCEL

Operasi matriks yang sering digunakan dalam rangkaian proses analisis dalam statistika antara lain menghitung : penjumlahan, pengurangan, perkalian, invers, nilai determinan, trace, nilai eigen dan banyak lagi lainnya. Pada postingan ini hanya akan dibahas teknis menghitung nilai determinan, perkalian matriks dan invers matriks dalam MS Excel. Sebagai contoh akan digunakan matriks A dan B yang berordo 3×3.

Matrik A

2     4     3
6     1     5
9     8     7

Matrik B

2     5     7
8     3     6
4     5     3

 

(i) Menghitung Nilai Determinan

Matriks A ada pada sel B2:D4. Posisikan sel pada F2, pilih menu Formulas | Insert Function, pada kotak or select a category pilih Math & Trig, kemudian dalam kotak select a function cari MDETERM, klik OK (Lihat Gambar 1). Selanjutnya pada kotak Array, masukkan area sel matrik (dalam contoh ini adalah B2:D4), klik OK (Lihat Gambar 2). Maka pada sel F2 akan dihasilkan nilai 63 sebagai nilai determinan matrik A atau ditulis |A|. Dengan cara yang sama hasil untuk |B| adalah 154.

Slide1

 

Slide2

 

(ii) Menghitung Hasil Kali Matrik

Perkalian matrik A dan B mengharuskan kolom A sama dengan baris B. Langkah teknis dalam Excel. Blok area hasil perkalian matriks, pada contoh ini adalah B10:D12.

Pilih menu Formula | Insert Function pada kotak or select a category pilih Math & Trig, cari MMULT dalam kotak select a function, klik OK (Gambar 3). Isikan matrik A dengan melakukan blocking pada area sel B2:D4 sebagai array1 (setelah blocking dalam kotak akan terisi tulisan B2:D4).

Slide3

Pindahkan kursor ke kotak Array2, isikan matrik B dengan melakukan blocking pada area sel B6:D8 sebagai array2 (setelah blocking dalam kotak akan terisi tulisan B6:D8). Jangan klik OK, tetapi secara bersamaan tekan Shift+Ctrl+Enter, maka akan dihasilkan hasil kali matrik (Gambar 4).

Slide4

 

(iii) Menghitung Invers Matrik

Sebagai contoh akan dihitung invers matrik dari hasil kali matrik A dan B (hasil perkalian ada pada sel B10:D12. Pertama blok area sebagai tempat hasil invers matriks, pada contoh ini adalah B14:D16.

Pilih menu Formula | Insert Function pada kotak or select a category pilih Math & Trig, cari MINVERSE dalam kotak select a function, klik OK. Pada isian di kotak Array isikan sel sesuai matrik yang akan dihitung inversnya yaitu B10:D12. Jangan klik OK, tetapi secara bersamaan tekan Shift+Ctrl+Enter, maka akan dihasilkan hasil invers matrik (Gambar 5).

Slide5

 

Selamat mencoba. Semoga bermanfaat. Informasi dan permintaan training bisa menghubungi pak Khasanuddin di 0817.048.77.26

Posted in BASIC STATISTICS | Tagged , , , | Leave a comment

SAMPLE DAN IMPLIED COVARIANCE

Menguji kecocokan model dilakukan dengan uji chi square. Parameter apa yang diuji dalam chi square? Parameter yang diuji adalah perbandingan matriks kovarian dari data (sigma) dan dari model (S). Hipotesis statistik dinyatakan :

H0       : sigma  = S, melawan
H1       : sigma tidak sama dengan  S

Jika H0 diterima, berarti kedua matrik kovarian adalah berbeda tidak signifikan. Implikasi dari hasil uji ini adalah bukti bahwa data empiris mendukung model. H0 diterima jika nilai probabilitas (p) lebih besar dari tingkat signifikansi (significant level) sebesar a (alpha) yang direncanakan.

Slide1

Untuk menampilkan kedua matriks kovarian ini, harus dilakukan setting output untuk sample dan implied moment. Langkah yang dimaksud adalah, pilih menu View | Analysis Properties, tambahkan untuk mengaktifkan sample dan implied moment (Lihat Gambar 1).

Slide2

Pada output, didapatkan bahwa dalam sample moment terhitung dua hasil yaitu sample covariance dan sample correlations (lihat Gambar 2). Selanjutnya matriks kovarian pada model didapatkan pada kelompok Estimates | Matrices yang bernama implied covariance dan correlations (Gambar 3).

Slide3

Kedua matriks kovarian ini tampak tidak jauh berbeda. Perbedaan keduanya akan diputuskan lewat hasil uji chi square yang menghasilkan nilai 7,853 dan p = 0,448. Maka hasil uji perbandingan kedua matriks kovarian ini memutuskan untuk menerima H0 (p>0,05). Kesimpulan dari hasil analisis bahwa data empiris mendukung model yang diuji. (Gambar 4)

Slide4

Posted in MODEL SEM, MULTIVARIATE | Tagged , , , , | Leave a comment

MENENTUKAN JUMLAH CLUSTER

Sembilan kota di Jawa yaitu : Surabaya, Bangkalan, Lumajang, Malang, Klaten, Salatiga, Bandung, Cirebon dan Garut dinilai dari 3 hal yaitu infrastruktur, investasi dan kelestarian lingkungan dengan skor 1-5. Data bahan analisis data bisa dilihat pada Gambar 1.

Slide1

Selanjutnya akan dilakukan analisis pengelompokan kota-kota tersebut dengan hirarchical cluster menggunakan prosedur complete linkage. Jarak antar kota dihitung dengan kuadrat jarak Mahalanobis (square Mahalanobis distance).

Software akan menghitung matriks jarak sesuai pilihan dan akan menampilkan hasil proximity matrix sebagai matriks jarak serta agglomeration schedule sebagai informasi penyusunan dendrogram. (Lihat Gambar 2).

Slide2

Lalu bagaimanakah cara menentukan jumlah cluster yang terbentuk? Diantara pilihan yang ada antara lain : menghitung “sudden jump” dari perubahan koefisien yang ada dalam tabel agglomeration schedule. Perhitungan dilakukan mulai dari koefisien terakhir. Dalam contoh ini, karena ada 9 obyek yang dikelompokkan, maka akan ada 8 stage yang dihitung untuk menghasilkan dendrogram secara lengkap.

Pada stage ke-8 dihasilkan koefisien sebesar 14, sedangkan koefisien pada stage ke-7 adalah 8. Maka perubahan koefisien untuk stage ke-8 adalah (14-8)/8 x 100% yaitu 75%. Lakukan perhitungan yang sama hingga beberapa stage (dimulai dari stage terakhir ke atas, akan tetapi tidak perlu dilakukan perhitungan untuk seluruh stage). Akan dicari perubahan koefisien yang paling besar. Jika hasil perhitungan perubahan koefisien pada stage ke-8 adalah paling besar maka akan merekomendasikan cluster berjumlah dua. Jika hasil perhitungan perubahan koefisien pada stage ke-7 adalah paling besar maka akan merekomendasikan cluster berjumlah tiga. Begitu seterusnya seperti yang ada pada Gambar 3.

Slide3

Hasil akhir pada contoh ini memberikan kesimpulan bahwa akan terbentuk 2 cluster. Pada cluster pertama beranggotakan : Lumajang, Bandung, Malang, Cirebon, sedangkan pada cluster kedua adalah : Surabaya, Bangkalan, Klaten, Garut, Salatiga.

Slide4

Selamat mencoba. Semoga bermanfaat. Informasi dan permintaan training bisa menghubungi pak Khasanuddin di 0817.048.77.26

Posted in MULTIVARIATE | Tagged , , , , , , | Leave a comment

TABULASI SILANG DAN CORRESPONDEN ANALYSIS

Pada 220 sampel, terbagi atas 60 orang tergolong berusia muda, 90 adalah paruh baya dan 70 orang termasuk lanjut usia. Ketiga kelompok usia ini diamati pilihan produk yang dibeli, apakah produk A, B atau C.

Komposisi jenis produk yang dibeli pada kelompok usia muda adalah A (20 orang), B (20 orang) dan C (20 orang). Usia yang lebih tua di kelompok paruh baya, komposisi pembelian adalah A (40 orang), B (10 orang) dan C (40) orang. Sedangkan pada kelompok terakhir yaitu usia lanjut usia, frekuensi pembelian adalah A (20 orang), B (10 orang) dan C (40 orang).

Slide1

Produk manakah yang menjadi ciri masing-masing kelompok usia? Cukup sulit untuk menentukan pilihan produk kelompok muda karena hampir semua produk mempunyai proporsi yang sama ketika dipilih. Begitu pula pada kelompok usia paruh bay, komposisi produk A dan C juga sama. Jawaban yang paling mudah adalah pada kelompok lanjut usia yang cenderung memilih produk C.

Pertanyaan tersebut bisa dijawab lewat dua kemungkinan yaitu : (1) membuat tabel silang atas frekuensi dari kedua katergori (Gambar 1) atau (2) menghitung peta jarak Chi Square dengan correspondence analysis (Gambar 2).

Slide2

Pada tabel silang (crosstabulation), bisa dilihat komposisi pilihan lewat informasi berbasis baris atau kolom. Sedangkan pada pilihan correspondence analysis tersedia pada software SPSS akan dijawab dari hasil biplot. Pilihan analisis ini ada pada menu Analyze | Dimension Reduction | Correspondence Analysis.

Slide3

Posted in MULTIVARIATE | Tagged , , , | Leave a comment

CONFIDENCE INTERVAL

Confidence interval artinya selang keyakinan atau tingkat kepercayaan. Menghitung selang kepercayaan ini sangat bermanfaat untuk menaksir rentang data sesuai dengan besarnya kepercayaan yang diinginkan. Data yang masuk dalam selang kepercayaan dihitung dari nilai mean dan menyebar ke bawah dan ke atas nilai rata-rata sesuai dengan persentase yang diinginkan.

Slide1

Perhatikan pada Tabel Data contoh yang berjumlah 100 sampel, mempunyai nilai rata-rata 65,64 dan standard deviasi 19,10. Data terendah adalah 21 dan tertinggi 115. Berdasarkan urutan data dari kecil ke besar, pada 90% data berkisar antara 35 – 95. Lihat Gambar 1.

Rumus untuk menghitung batas bawah dan atas pada selang kepercayaan (1-aplha) adalah:

Bawah : rata-rata – z(alpha/2)*standard deviasi
Atas     : rata-rata + z(alpha/2)*standard deviasi

Nilai Z pada kepercayaan 90% adalah 1.645. Sehingga berdasarkan rumus tersebut didapatkan batas bawah dan atas sebagai berikut :

Bawah             : 65,64 – (1.645)(19.10) = 34.22
Atas                 : 65,64 + (1.645)(19.10) = 97.06

Perhitungan ini menyatakan bahwa jika dihitung dari nilai mean, maka 90% data akan berada pada kisaran 34,22 hingga 97,06.

Slide2

Hasil ini akan mendekati karakteristik data yang sesungguhnya, apabila distribusi data terbukti mengikuti distribusi Normal. Untuk selang kepercayaan 80% dapat dilihat pada Gambar 3.

Slide3

Semoga bermanfaat.

Posted in BASIC STATISTICS | Tagged , | Leave a comment

MENGHITUNG SKOR FAKTOR DENGAN TEKNIK IMPUTATION

Penjelasan tentang cara menghitung skor faktor diambil dari Garson (2012). Perhatikan Gambar 1 yang menjelaskan sebuah model single factor dengan 4 indikator (Y2.1, Y2.2, Y2.3 dan Y2.4). Dalam file data yang diolah hanya tersedia data untuk Y2.1 hingga Y2.4. Sedangkan pada unobservable (variabel laten) dengan simbol gambar lingkaran diberi nama Kinerja tidak mempunyai data.

Pertanyaannya adalah, apakah akan dihasilkan skor untuk kinerja? Jawabannya adalah : Bisa. Skor baru yang diperoleh dari hubungan keempat indikator terhadap kinerja disebut dengan skor faktor (factor score).

Data yang digunakan :

Slide1

Berikut ini adalah satu dari dua cara untuk menghitung skor faktor dalam AMOS dengan menggunakan teknik Imputation.

 

  1. Pastikan bahwa input data dalam AMOS menggunakan data mentah, bukan matriks korelasi dan nilai lainnya (telah dijelaskan pada materi #002, 27 Desember 2014). Data yang dipakai dalam contoh ini bisa dilihat dalam Tabel.
  2. Buat model single factor seperti pada Gambar 1
  3. Pilih menu View | Analysis Propoerties, cari sub menu Output dan aktifkan pilihan Factor score weight (Gambar 2)
  4. Pilih menu Analyze | Data Imputation (Gambar 3)
  5. Hitung skor faktor dengan klik kotak Impute. Pada file ini bernama SkorFaktor.sav, maka nanti akan dihasilkan file baru dengan nama SkorFaktor_C.sav yang didalamnya sudah terhitung skor faktor untuk variabel laten Kinerja (Gambar 4).

 

Slide2Gambar 1 . Model Singke Factor Kinerja

 

 

Slide3

 

 

Gambar 2. Setting score factor pada Output AMOS

 

 

 

 

 

Slide4Gambar 3. Data Imputation

 

 

 

 

 

Slide5Gambar 4. Hitung Skor Faktor dan menyimpan filenya

 

 

 

 

Selamat mencoba. Semoga bermanfaat. Informasi dan permintaan training bisa menghubungi pak Khasanuddin di 0817.048.77.26

Referensi :

Garson, G. David. 2012. Structural Equation Modeling. Statistical Associates Publishing. Hal. 85-87

Posted in MODEL SEM | Tagged , | Leave a comment