Regresi linear berganda adalah sebuah metode statistik yang digunakan untuk memprediksi nilai dari suatu variabel dependen (variabel terikat) berdasarkan nilai dari dua atau lebih variabel independen (variabel bebas). Berbeda dengan regresi linear sederhana yang hanya melibatkan satu variabel independen, regresi linear berganda memungkinkan kita untuk memahami pengaruh gabungan dari beberapa faktor terhadap suatu hasil. Artikel ini akan membahas bagaimana melakukan analisis regresi linear berganda secara manual, langkah demi langkah, tanpa bantuan perangkat lunak statistik yang kompleks.
Ilustrasi konseptual: Regresi linear berganda memodelkan Y berdasarkan X1 dan X2.
Dalam regresi linear berganda, model matematisnya dapat dituliskan sebagai berikut:
Y = β₀ + β₁X₁ + β₂X₂ + ... + βkXk + ε
Di mana:
Melakukan regresi linear berganda secara manual memang memerlukan ketelitian dan kesabaran, terutama jika jumlah variabel independennya banyak. Namun, memahami prosesnya sangat penting untuk interpretasi yang akurat. Berikut adalah langkah-langkah utamanya:
Langkah pertama adalah mengumpulkan data yang relevan. Pastikan Anda memiliki observasi untuk variabel dependen (Y) dan semua variabel independen (X₁, X₂, dst.). Data perlu dibersihkan dari nilai yang hilang atau anomali jika memungkinkan.
Hitung rata-rata, standar deviasi, dan matriks korelasi untuk semua variabel. Matriks korelasi akan memberikan gambaran awal tentang hubungan linear antar variabel.
Ini adalah inti dari perhitungan manual. Untuk regresi linear berganda dengan k variabel independen, kita perlu menyelesaikan sistem k+1 persamaan untuk menemukan koefisien regresi (β₀, β₁, ..., βk). Sistem persamaan ini dikenal sebagai persamaan normal:
nβ₀ + (ΣX₁)β₁ + (ΣX₂)β₂ + ... + (ΣXk)βk = ΣY
(ΣX₁)β₀ + (ΣX₁²)β₁ + (ΣX₁X₂)β₂ + ... + (ΣX₁Xk)βk = ΣX₁Y
(ΣX₂)β₀ + (ΣX₂X₁)β₁ + (ΣX₂²)β₂ + ... + (ΣX₂Xk)βk = ΣX₂Y
...
(ΣXk)β₀ + (ΣXkX₁)β₁ + (ΣXkX₂)β₂ + ... + (ΣXk²)βk = ΣXkY
Di mana n adalah jumlah observasi. Anda perlu menghitung semua nilai jumlah (Σ) ini dari data Anda.
Setelah sistem persamaan normal terbentuk, Anda perlu menyelesaikannya untuk mendapatkan nilai β₀, β₁, ..., βk. Metode penyelesaian yang umum meliputi:
Bagi mereka yang belum terbiasa dengan aljabar linier, metode eliminasi mungkin lebih mudah diikuti langkah demi langkah, meskipun memakan waktu.
Setelah koefisien regresi ditemukan, Anda dapat menyusun persamaan regresi akhir:
Ŷ = β̂₀ + β̂₁X₁ + β̂₂X₂ + ... + β̂kXk
Di mana Ŷ (Y topi) adalah nilai prediksi dari Y.
Evaluasi model sangat penting untuk mengetahui seberapa baik model Anda menjelaskan data. Ini meliputi:
Meskipun perangkat lunak statistik modern membuat perhitungan regresi menjadi sangat mudah, melakukan analisis secara manual memberikan pemahaman mendalam tentang cara kerja di balik layar. Ini membantu dalam:
Secara keseluruhan, regresi linear berganda manual adalah latihan yang berharga bagi siapa saja yang ingin menguasai analisis statistik.