Dalam dunia analisis data, kemampuan untuk memahami dan memodelkan hubungan antara variabel adalah fundamental. Salah satu teknik yang paling dasar namun kuat adalah regresi linier. Ketika kita berbicara tentang uji regresi linier sederhana manual, kita merujuk pada proses perhitungan dan interpretasi koefisien regresi tanpa sepenuhnya bergantung pada perangkat lunak statistik canggih, sehingga memberikan pemahaman yang lebih mendalam tentang bagaimana perhitungan tersebut bekerja.
Regresi linier sederhana adalah metode statistik yang digunakan untuk memodelkan hubungan antara dua variabel: satu variabel dependen (variabel yang ingin kita prediksi atau jelaskan) dan satu variabel independen (variabel yang kita gunakan untuk memprediksi variabel dependen). Hubungan ini diasumsikan linier, yang berarti kita dapat menggambarkannya sebagai garis lurus pada grafik.
Tujuan utama regresi linier sederhana adalah untuk menemukan persamaan garis lurus yang paling baik "cocok" dengan sekumpulan titik data. Persamaan garis ini biasanya dinyatakan sebagai:
Y = β₀ + β₁X + ε
Di mana:
Melakukan perhitungan manual mungkin terdengar menakutkan, tetapi memahaminya sangat berharga. Berikut adalah langkah-langkah utamanya:
Langkah pertama adalah mengumpulkan pasangan data (X, Y) yang relevan untuk variabel yang ingin Anda analisis. Misalnya, jika Anda ingin mengetahui hubungan antara jam belajar (X) dan nilai ujian (Y), Anda perlu mengumpulkan data jam belajar dan nilai ujian dari sejumlah siswa.
Hitung nilai rata-rata (mean) untuk X (dilambangkan X̄) dan Y (dilambangkan Ȳ). Hitung juga varians atau standar deviasi untuk X dan Y, serta kovarians antara X dan Y. Namun, untuk perhitungan koefisien regresi secara langsung, kita lebih fokus pada nilai jumlah kuadrat dan jumlah perkalian.
Ini adalah inti dari regresi linier. Koefisien β₁ (slope) dihitung menggunakan rumus:
β₁ = Σ[(Xi - X̄)(Yi - Ȳ)] / Σ[(Xi - X̄)²]
Atau bisa juga dihitung dengan:
β₁ = [nΣ(XiYi) - (ΣXi)(ΣYi)] / [nΣ(Xi²) - (ΣXi)²]
Di mana:
Setelah β₁ dihitung, koefisien β₀ (intercept) dapat dihitung dengan mudah:
β₀ = Ȳ - β₁X̄
Dengan β₀ dan β₁ yang sudah didapatkan, Anda dapat menghitung nilai Y yang diprediksi (Ŷ) untuk setiap nilai X:
Ŷ = β₀ + β₁X
Sisa (e) adalah perbedaan antara nilai Y sebenarnya dan nilai Y yang diprediksi:
e = Y - Ŷ
Sisa ini penting untuk mengevaluasi kualitas model dan memeriksa asumsi-asumsi regresi.
Meskipun ada banyak perangkat lunak yang dapat melakukan regresi linier dengan mudah, memahami proses manual memberikan beberapa keuntungan:
Setelah menghitung β₀ dan β₁, interpretasinya sangat penting. Nilai β₁ memberi tahu Anda seberapa besar perubahan yang diharapkan pada Y ketika X meningkat satu unit. Nilai β₀ memberi tahu Anda nilai dasar Y ketika X adalah nol. Penting juga untuk mempertimbangkan tingkat signifikansi statistik dari koefisien regresi (biasanya menggunakan uji-t atau F-test) dan nilai R-squared untuk mengukur seberapa baik model menjelaskan variabilitas dalam data, meskipun uji signifikansi dan R-squared seringkali memerlukan perhitungan lebih lanjut atau alat statistik.
Dengan memahami langkah-langkah uji regresi linier sederhana manual, Anda memiliki dasar yang kuat untuk menerapkan dan menafsirkan analisis regresi dalam berbagai konteks.