Contoh Analisis Regresi Logistik: Memprediksi Kelulusan Mahasiswa

Regresi Logistik: Prediksi Kelulusan Input (Nilai Ujian, Absensi) -> Output (Lulus/Tidak Lulus)

Visualisasi sederhana konsep regresi logistik.

Analisis regresi logistik adalah metode statistik yang digunakan untuk memprediksi probabilitas suatu kejadian biner (dua hasil yang mungkin). Dalam konteks ini, kita akan membahas sebuah contoh sederhana untuk memprediksi apakah seorang mahasiswa akan lulus atau tidak lulus ujian berdasarkan beberapa faktor input.

Mengapa Regresi Logistik?

Regresi logistik dipilih karena variabel dependen (hasil yang ingin diprediksi) bersifat kategorikal, yaitu hanya memiliki dua kemungkinan nilai: lulus atau tidak lulus. Berbeda dengan regresi linear yang memprediksi nilai kontinu, regresi logistik memodelkan probabilitas, yang kemudian dapat dikonversi menjadi klasifikasi biner.

Skenario Contoh

Misalkan kita memiliki data historis mahasiswa yang mencakup:

Tujuan kita adalah membangun model regresi logistik yang dapat memprediksi probabilitas kelulusan seorang mahasiswa berdasarkan nilai UTS dan tingkat absensinya.

Proses Analisis

1. Pengumpulan dan Persiapan Data

Langkah pertama adalah mengumpulkan data yang relevan. Data ini harus dibersihkan, ditangani jika ada nilai yang hilang (missing values), dan dipastikan dalam format yang sesuai untuk analisis statistik. Kita akan mengasumsikan data sudah siap.

2. Pemilihan Variabel

Dalam contoh ini, variabel independen kita adalah Nilai UTS dan Tingkat Absensi. Variabel dependen adalah Status Kelulusan (biner: 0 atau 1).

3. Pemodelan Regresi Logistik

Model regresi logistik menggunakan fungsi logit (log-odds) untuk menghubungkan variabel independen dengan probabilitas variabel dependen. Persamaan dasarnya adalah:

log(P(Y=1) / (1 - P(Y=1))) = β₀ + β₁X₁ + β₂X₂

Dimana:

Koefisien β ini diestimasi dari data menggunakan metode seperti Maximum Likelihood Estimation (MLE).

4. Interpretasi Hasil

Setelah model dilatih, kita akan mendapatkan nilai koefisien β. Contoh interpretasi:

Kita juga akan melihat nilai-nilai statistik lain seperti p-value untuk menguji signifikansi variabel, dan rasio odds (odds ratio) yang lebih mudah diinterpretasikan.

5. Evaluasi Model

Model yang telah dilatih dievaluasi menggunakan berbagai metrik seperti:

Evaluasi ini penting untuk memastikan bahwa model memberikan prediksi yang andal.

Contoh Implementasi (Konsep Kode)

Berikut adalah gambaran konseptual bagaimana analisis ini bisa diimplementasikan menggunakan Python dengan pustaka `scikit-learn`:

from sklearn.linear_model import LogisticRegression from sklearn.model_selection import train_test_split from sklearn.metrics import accuracy_score # Asumsikan 'X' berisi fitur (Nilai_UTS, Absensi) dan 'y' berisi target (Status_Kelulusan) # X = ... # y = ... # Membagi data menjadi set pelatihan dan pengujian X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42) # Membuat objek model regresi logistik model = LogisticRegression() # Melatih model model.fit(X_train, y_train) # Melakukan prediksi pada data uji y_pred = model.predict(X_test) # Mengevaluasi akurasi model accuracy = accuracy_score(y_test, y_pred) print(f"Akurasi Model: {accuracy:.2f}") # Mendapatkan koefisien dan intercept print(f"Koefisien: {model.coef_}") print(f"Intercept: {model.intercept_}")

Kesimpulan

Analisis regresi logistik adalah alat yang sangat berguna untuk memprediksi hasil biner. Dalam contoh ini, kita dapat menggunakan nilai UTS dan tingkat absensi untuk memprediksi probabilitas kelulusan mahasiswa. Dengan memahami prosesnya, mulai dari persiapan data, pemodelan, hingga evaluasi, kita dapat membangun model yang informatif dan dapat diandalkan untuk berbagai skenario.

🏠 Homepage