Analisis multivariat merupakan salah satu cabang statistik yang sangat penting dalam berbagai disiplin ilmu, mulai dari kedokteran, ekonomi, hingga ilmu sosial. Salah satu teknik analisis multivariat yang sering digunakan untuk memprediksi probabilitas suatu kejadian berdasarkan beberapa variabel independen adalah regresi logistik. Terlebih lagi ketika variabel dependen yang diamati bersifat dikotomi (misalnya, lulus/tidak lulus, sakit/sehat, ya/tidak), regresi logistik menjadi alat yang sangat relevan.
SPSS (Statistical Package for the Social Sciences) adalah perangkat lunak statistik yang sangat populer dan banyak digunakan. Kombinasi analisis regresi logistik dengan SPSS memungkinkan peneliti untuk melakukan pemodelan prediktif yang kompleks dengan antarmuka yang relatif mudah digunakan. Artikel ini akan membahas secara mendalam mengenai analisis regresi logistik dan bagaimana mengimplementasikannya menggunakan SPSS, termasuk interpretasi hasilnya.
Berbeda dengan regresi linear biasa yang memprediksi nilai variabel dependen kontinu, regresi logistik digunakan ketika variabel dependennya bersifat kategorikal. Untuk kasus paling sederhana, yaitu variabel dependen dikotomi (memiliki dua kategori, sering dilambangkan sebagai 0 dan 1), regresi logistik memodelkan probabilitas salah satu kategori terjadi. Fungsi logistik (sigmoid function) digunakan untuk mengubah keluaran linear dari variabel independen menjadi probabilitas antara 0 dan 1.
Rumus dasar yang sering dikaitkan dengan regresi logistik adalah log-odds (logit), di mana:
logit(P(Y=1)) = log(P(Y=1) / P(Y=0)) = β₀ + β₁X₁ + β₂X₂ + ... + βnXn
Di sini:
P(Y=1) adalah probabilitas kejadian Y bernilai 1.P(Y=0) adalah probabilitas kejadian Y bernilai 0.β₀ adalah intercept (konstanta).β₁, β₂, ..., βn adalah koefisien regresi untuk variabel independen X₁, X₂, ..., Xn.Koefisien regresi (β) dalam regresi logistik menginterpretasikan perubahan dalam log-odds dari variabel dependen ketika variabel independen meningkat satu unit, dengan variabel lain dianggap konstan. Untuk mempermudah interpretasi, koefisien ini sering diubah menjadi odds ratio (OR) dengan rumus OR = exp(β). Odds ratio yang lebih besar dari 1 menunjukkan peningkatan kemungkinan kejadian, sedangkan odds ratio kurang dari 1 menunjukkan penurunan kemungkinan kejadian.
Melakukan analisis regresi logistik di SPSS cukup straightforward. Berikut adalah langkah-langkah umumnya:
Analyze > Regression > Binary Logistic... (jika variabel dependen Anda memiliki dua kategori). Jika variabel dependen memiliki lebih dari dua kategori dan tidak berurutan, gunakan Multinomial Logistic....Dependent.Covariates.Options... atau langsung di dialog utama.Categorical.... Untuk variabel kategorikal, Anda mungkin perlu memilih metode pengkodean (misalnya, indicator, dummy).Save... untuk menyimpan nilai prediksi atau residual, atau klik Options... untuk mendapatkan statistik tambahan seperti Hosmer-Lemeshow goodness-of-fit test, klasifikasi plot, dan Ci for exp(B) (confidence interval untuk odds ratio).OK untuk menjalankan analisis.Output SPSS untuk regresi logistik akan menyajikan beberapa tabel penting:
Tabel ini menunjukkan seberapa baik model memprediksi kategori variabel dependen. Ini mencakup akurasi prediksi keseluruhan, serta presisi dan recall untuk setiap kategori.
Tabel ini adalah jantung dari output regresi logistik. Kolom-kolom penting meliputi:
Uji seperti Hosmer-Lemeshow (jika dipilih) digunakan untuk menilai apakah model secara keseluruhan cocok dengan data. Nilai p yang tinggi (misalnya, > 0.05) menunjukkan bahwa model tidak secara signifikan berbeda dari data yang diamati, yang merupakan indikasi model yang baik.
Dengan memahami konsep dasar regresi logistik dan menguasai langkah-langkah implementasinya di SPSS, peneliti dapat menggali lebih dalam data mereka untuk menemukan pola prediktif yang berharga. Analisis ini sangat berguna dalam membuat keputusan berbasis bukti dan mengembangkan strategi yang lebih efektif.