Analisis regresi linier sederhana adalah alat statistik yang ampuh untuk memahami hubungan antara dua variabel, di mana satu variabel (variabel independen) diduga mempengaruhi variabel lainnya (variabel dependen). Salah satu output paling penting dari analisis ini adalah tabel regresi, yang menyajikan ringkasan data dan hasil statistik kunci yang membantu kita menarik kesimpulan.
Komponen Kunci dalam Tabel Regresi Linier Sederhana
Ketika Anda menjalankan analisis regresi linier sederhana menggunakan perangkat lunak statistik (seperti R, Python dengan SciPy/StatsModels, SPSS, atau Excel), Anda akan disajikan dengan sebuah tabel. Tabel ini biasanya mengandung beberapa baris dan kolom penting yang perlu dipahami:
1. Sumber Variasi (Source of Variation)
Bagian ini memecah total variasi dalam variabel dependen menjadi komponen-komponen yang dapat dijelaskan oleh model regresi dan yang tidak dapat dijelaskan (error).
Regression (Regresi) / Model: Variasi dalam variabel dependen yang berhasil dijelaskan oleh variabel independen melalui model regresi.
Residual / Error (Sisaan): Variasi dalam variabel dependen yang tidak dapat dijelaskan oleh model regresi. Ini adalah perbedaan antara nilai observasi aktual dan nilai yang diprediksi oleh model.
Total: Variasi total dalam variabel dependen, yang merupakan jumlah variasi dari regresi dan residual.
2. Derajat Kebebasan (Degrees of Freedom - df)
Derajat kebebasan merepresentasikan jumlah informasi independen yang tersedia untuk memperkirakan parameter model.
df Regresi: Biasanya sama dengan jumlah variabel independen, yang dalam regresi linier sederhana adalah 1.
df Residual: Jumlah observasi (n) dikurangi jumlah parameter yang diperkirakan (termasuk intercept), jadi (n - 2) untuk regresi linier sederhana.
df Total: Jumlah observasi (n) dikurangi 1, yaitu (n - 1).
3. Jumlah Kuadrat (Sum of Squares - SS)
Jumlah kuadrat mengukur total variasi dalam setiap sumber.
SS Regression (SSR): Mengukur variasi yang dijelaskan oleh regresi.
SS Residual (SSE) / SS Error: Mengukur variasi yang tidak dijelaskan oleh regresi (error).
SS Total (SST): Mengukur total variasi dalam variabel dependen. Rumusnya adalah SST = SSR + SSE.
4. Rata-rata Kuadrat (Mean Square - MS)
Rata-rata kuadrat dihitung dengan membagi jumlah kuadrat dengan derajat kebebasannya.
MS Regression (MSR):SSR / df Regresi.
MS Residual (MSE) / MS Error:SSE / df Residual. MSE juga merupakan estimasi dari varians error (σ²).
5. Statistik Uji F (F-statistic)
Statistik uji F dihitung sebagai rasio antara MS Regression dan MS Residual: F = MSR / MSE. Statistik F digunakan untuk menguji signifikansi keseluruhan model regresi. Jika nilai F signifikan secara statistik, ini berarti bahwa variabel independen secara signifikan menjelaskan variasi dalam variabel dependen.
6. Nilai-p (p-value) untuk F
Nilai-p yang terkait dengan uji F menunjukkan probabilitas mengamati statistik F sebesar yang dihitung (atau lebih ekstrem) jika hipotesis nol (bahwa tidak ada hubungan linier antara variabel) benar. Jika nilai-p lebih kecil dari tingkat signifikansi yang ditentukan (misalnya, 0.05), kita menolak hipotesis nol dan menyimpulkan bahwa model regresi secara signifikan memprediksi variabel dependen.
Interpretasi Tabel Regresi
Memahami setiap komponen dalam tabel regresi memungkinkan kita untuk mengevaluasi kualitas model dan signifikansi hubungan.
Contoh Tabel Regresi Sederhana:
Sumber Variasi
df
Jumlah Kuadrat (SS)
Rata-rata Kuadrat (MS)
Statistik F
Nilai-p (p-value)
Regresi
1
150.50
150.50
25.30
0.0001
Residual
30
178.20
5.94
-
-
Total
31
328.70
-
-
-
Dari tabel contoh di atas:
Statistik F sebesar 25.30 menunjukkan bahwa variasi yang dijelaskan oleh model (Regresi) jauh lebih besar daripada variasi yang tidak dijelaskan (Residual).
Nilai-p yang sangat kecil (0.0001) menunjukkan bahwa model regresi ini signifikan secara statistik pada tingkat signifikansi 0.05. Ini berarti kita dapat menolak hipotesis nol dan menyimpulkan bahwa ada hubungan linier yang signifikan antara variabel independen dan dependen.
Manfaat Memahami Tabel Regresi
Menguasai interpretasi tabel regresi linier sederhana sangat penting bagi siapa pun yang bekerja dengan data. Ini memungkinkan Anda untuk:
Menentukan apakah variabel independen Anda secara signifikan mempengaruhi variabel dependen.
Menilai seberapa baik model regresi Anda menjelaskan variasi dalam data (melalui nilai-p dan ukuran kecocokan seperti R-squared, yang sering kali juga disertakan dalam output regresi).
Membuat keputusan yang lebih baik berdasarkan temuan statistik.
Dengan memahami setiap komponen dalam tabel regresi, Anda dapat lebih percaya diri dalam menginterpretasikan hasil analisis Anda dan mengkomunikasikannya secara efektif kepada orang lain.