Dalam dunia analisis data, pemahaman terhadap hubungan antara variabel independen (prediktor) dan variabel dependen (respons) adalah kunci untuk membuat prediksi yang akurat dan pengambilan keputusan yang tepat. Ketika variabel dependen bersifat kategorik biner (misalnya, ya/tidak, lulus/gagal, sakit/sehat), metode analisis regresi logistik menjadi sangat relevan. Artikel ini akan mengupas tuntas mengenai analisis multivariat regresi logistik, termasuk konsep dasarnya, cara kerjanya, interpretasinya, dan aplikasinya.
Regresi logistik adalah teknik statistik yang digunakan untuk memodelkan probabilitas suatu kejadian atau klasifikasi. Berbeda dengan regresi linear yang memprediksi variabel dependen kontinu, regresi logistik dirancang khusus untuk variabel dependen yang hanya memiliki dua kategori (biner) atau lebih dari dua kategori yang bisa diurutkan (ordinal). Intinya, regresi logistik memprediksi probabilitas suatu observasi termasuk dalam kategori tertentu.
Perbedaan mendasar regresi logistik dengan regresi linear terletak pada fungsi yang digunakan. Regresi linear menggunakan fungsi linear sederhana, sedangkan regresi logistik menggunakan fungsi logistik (atau fungsi sigmoid). Fungsi logistik mentransformasi output dari model linear menjadi nilai antara 0 dan 1, yang dapat diinterpretasikan sebagai probabilitas.
Rumus dasar yang sering digunakan adalah:
log(P / (1-P)) = β₀ + β₁X₁ + β₂X₂ + ... + βnXn
Di mana:
Koefisien regresi (β) dalam regresi logistik mengukur perubahan dalam log-odds ketika variabel prediktor berubah satu unit, dengan asumsi variabel lain konstan. Nilai eksponensial dari koefisien regresi (e^β) memberikan interpretasi yang lebih mudah, yaitu Odds Ratio (OR).
Interpretasi utama dalam regresi logistik adalah melalui Odds Ratio (OR).:
Selain OR, ukuran lain yang penting adalah nilai p (p-value) untuk setiap koefisien regresi. Nilai p yang kecil (biasanya < 0.05) menunjukkan bahwa variabel prediktor tersebut signifikan secara statistik dalam memprediksi variabel dependen. Uji kesesuaian model secara keseluruhan, seperti Uji Hosmer-Lemeshow, juga penting untuk mengevaluasi seberapa baik model cocok dengan data.
Regresi logistik adalah alat yang sangat serbaguna dan banyak digunakan di berbagai bidang, antara lain:
Anda harus mempertimbangkan penggunaan regresi logistik ketika:
Analisis multivariat regresi logistik adalah metode yang kuat dan esensial untuk memodelkan data dengan variabel dependen kategorik. Kemampuannya untuk memprediksi probabilitas dan mengukur kekuatan serta arah hubungan antara prediktor dan hasil membuatnya menjadi alat yang tak ternilai dalam analisis data di berbagai disiplin ilmu. Memahami konsep log-odds, Odds Ratio, dan signifikansi statistik sangat penting untuk interpretasi yang benar dan aplikasi yang efektif dari model regresi logistik.