Dalam dunia analisis data, seringkali kita dihadapkan pada situasi di mana variabel dependen yang ingin kita amati bersifat dikotomis atau biner. Artinya, hasil yang mungkin terjadi hanyalah dua pilihan, seperti "ya" atau "tidak", "lulus" atau "tidak lulus", "sembuh" atau "tidak sembuh", "membeli" atau "tidak membeli". Dalam kasus seperti ini, penggunaan model regresi linear tradisional akan menghasilkan prediksi yang tidak realistis, karena nilai prediksi bisa berada di luar rentang 0 hingga 1. Di sinilah peran krusial dari analisis multivariat regresi logistik berganda muncul sebagai solusi yang elegan dan kuat.
Regresi logistik berganda adalah sebuah metode statistik yang digunakan untuk memprediksi probabilitas suatu kejadian biner terjadi, berdasarkan nilai dari satu atau lebih variabel prediktor (independen). Berbeda dengan regresi linear yang memodelkan hubungan langsung antara variabel dependen dan independen, regresi logistik memodelkan logaritma dari odds (peluang) terjadinya kejadian tersebut. Odds sendiri adalah perbandingan antara probabilitas suatu kejadian terjadi dengan probabilitas kejadian tersebut tidak terjadi.
Istilah "berganda" merujuk pada penggunaan lebih dari satu variabel prediktor. Dengan memasukkan berbagai faktor yang relevan, kita dapat membangun model yang lebih komprehensif dan akurat dalam menjelaskan variasi pada variabel dependen biner.
Inti dari regresi logistik adalah fungsi logit, yang mengubah prediksi linear menjadi probabilitas. Fungsi logit (log-odds) dihitung sebagai berikut:
logit(P) = ln(P / (1 - P)) = β₀ + β₁X₁ + β₂X₂ + ... + βnXn
Di mana:
P adalah probabilitas kejadian biner terjadi.ln adalah logaritma natural.β₀ adalah intercept (konstanta).β₁, β₂, ..., βn adalah koefisien regresi untuk variabel prediktor X₁, X₂, ..., Xn.Koefisien regresi (β) menunjukkan perubahan pada log-odds ketika variabel prediktor yang bersesuaian berubah satu unit, dengan asumsi variabel lain konstan. Setelah nilai log-odds diperoleh, fungsi logistik (sigmoid) digunakan untuk mengubahnya kembali menjadi probabilitas antara 0 dan 1:
P = e^(β₀ + β₁X₁ + ... + βnXn) / (1 + e^(β₀ + β₁X₁ + ... + βnXn))
Atau sering disederhanakan menjadi:
P = 1 / (1 + e^-(β₀ + β₁X₁ + ... + βnXn))
Regresi logistik berganda sangat berguna dalam berbagai bidang, antara lain:
Interpretasi hasil regresi logistik berganda sedikit berbeda dari regresi linear. Kita biasanya melihat:
β): Menunjukkan arah dan kekuatan hubungan antara variabel prediktor dan log-odds variabel dependen. Nilai positif menunjukkan peningkatan log-odds, sedangkan nilai negatif menunjukkan penurunan.e^β). OR adalah interpretasi yang lebih intuitif. OR > 1 menunjukkan bahwa peningkatan satu unit pada variabel prediktor meningkatkan odds kejadian biner terjadi. OR < 1 menunjukkan penurunan odds. OR = 1 berarti tidak ada hubungan.Keunggulan:
Keterbatasan:
Secara keseluruhan, analisis multivariat regresi logistik berganda adalah alat yang sangat berharga bagi para analis data, peneliti, dan praktisi di berbagai bidang untuk memahami dan memprediksi hasil biner. Dengan pemahaman yang tepat mengenai cara kerja dan interpretasinya, metode ini dapat memberikan wawasan mendalam yang mendukung pengambilan keputusan yang lebih baik.