Ilustrasi sederhana representasi hubungan dalam regresi logistik
Regresi logistik berganda adalah salah satu teknik analisis statistik yang paling sering digunakan dalam berbagai bidang penelitian, mulai dari kedokteran, ilmu sosial, pemasaran, hingga rekayasa. Teknik ini sangat berguna ketika variabel dependen yang ingin diprediksi bersifat kategorikal, khususnya dikotomis (memiliki dua kategori, seperti ya/tidak, sukses/gagal, sakit/sehat).
Berbeda dengan regresi linear yang memprediksi nilai kontinu, regresi logistik memprediksi probabilitas suatu peristiwa terjadi. Dalam kasus regresi logistik berganda, terdapat lebih dari satu variabel independen (prediktor) yang digunakan untuk memprediksi probabilitas variabel dependen kategorikal tersebut.
Inti dari regresi logistik adalah penggunaan fungsi logit (log-odds) yang mengubah rentang probabilitas (0 hingga 1) menjadi rentang nilai tak terbatas (-∞ hingga +∞). Fungsi logit dihitung sebagai:
logit(P) = ln(P / (1 - P))
Dimana P adalah probabilitas kejadian yang diinginkan. Dalam model regresi logistik berganda, log-odds ini kemudian dinyatakan sebagai kombinasi linear dari variabel independen:
logit(P) = β₀ + β₁X₁ + β₂X₂ + ... + βnXn
Koefisien β (beta) menunjukkan perubahan dalam log-odds untuk setiap satu unit perubahan pada variabel independen yang sesuai, dengan asumsi variabel independen lainnya konstan.
Statistical Package for the Social Sciences (SPSS) adalah perangkat lunak statistik yang populer dan sangat membantu dalam melakukan analisis regresi logistik berganda. SPSS menyediakan antarmuka yang ramah pengguna, memungkinkan peneliti untuk memasukkan data, memilih variabel, menentukan jenis regresi, dan menginterpretasikan output dengan lebih mudah.
Keunggulan SPSS dalam analisis ini antara lain:
Berikut adalah panduan singkat untuk melakukan analisis regresi logistik berganda di SPSS:
Analyze > Regression > Binary Logistic....Output SPSS untuk regresi logistik berganda akan menyajikan beberapa bagian penting:
Tabel ini menunjukkan seberapa baik model Anda memprediksi kategori variabel dependen. Akurasi klasifikasi (classification accuracy) memberikan gambaran persentase prediksi yang benar.
Bagian ini adalah jantung dari analisis. Anda akan menemukan:
Uji Hosmer-Lemeshow biasanya digunakan di sini. Nilai p yang besar (misalnya > 0.05) menunjukkan bahwa model sesuai dengan data (tidak ada perbedaan signifikan antara probabilitas yang diamati dan yang diprediksi).
Regresi logistik berganda adalah alat yang ampuh untuk memprediksi hasil kategorikal. Dengan panduan yang tepat dan pemahaman terhadap output SPSS, peneliti dapat menggali wawasan berharga dari data mereka. Ingatlah untuk selalu memeriksa asumsi model dan mempertimbangkan konteks penelitian saat menginterpretasikan hasil.
Untuk studi lebih lanjut, Anda mungkin ingin mengeksplorasi jenis regresi logistik lain seperti regresi logistik ordinal atau multinomial, yang cocok untuk variabel dependen dengan lebih dari dua kategori.