BAB 4
REGRESI
LINIER BERGANDA
Pada bab ini jumlah variabel yang digunakan akan ditambah menjadi
lebih banyak, yaitu satu variabel Y dan jumlah variabel X nya lebih dari 1
(satu) variabel. Artinya, variabel X bisa berjumlah 2, 3, atau lebih. Jumlah X
yang lebih dari satu tersebut terkenal dengan istilah Regresi Linier Berganda
atau multiple linier regression. Bertambahnya jumlah variabel X hingga
lebih dari satu sangat memungkinkan, karena dalam keilmuan sosial semua
faktor-vaktor atau variabel-variabel saling
berkaitan
satu dengan lainnya.
Sebagai misal, munculnya inflasi tentu tidak hanya dipengaruhi
oleh bunga deposito (budep) saja seperti yang telah diterangkan di atas, tetapi
sangat mungkin dipengaruhi oleh faktor lain seperti perubahan nilai tukar (kurs),
jumlah uang beredar, kelangkaan barang, dan lain-lain.
Sebagaimana dalam teori inflasi, inflasi dapat digolongkan sebagai
inflasi karena tarikan permintaan dan inflasi desakan biaya. Inflasi tarikan
permintaan terjadi apabila masyarakat banyak memegang uang. Tentu secara singkat
dapat diartikan bahwa terdapat jumlah kelebihan jumlah uang beredar yang ada di
masyarakat. Selain itu dapat pula disebabkan ekspektasi masyarakat akibat adanya
perubahan nilai tukar uang.
Perubahan model dari bentuk single ke dalam bentuk
multiple
mengalami beberapa perubahan, meliputi:
1) jumlah
variabel penjelasnya bertambah, sehingga spesifikasi model dan data terjadi
penambahan.
2) rumus
penghitungan nilai b mengalami perubahan.
3) Jumlah
degree of freedom dalam menentukan nilai t juga berubah.
Model
Regresi Linier Berganda
Penulisan model regresi linier berganda merupakan pengembangan dari
model regresi linier tunggal. Perbedaannya hanya terdapat pada jumlah variabel
X saja. Dalam regresi linier tunggal hanya satu X, tetapi dalam regresi linier
berganda variabel X lebih dari satu. Model regresi linier umumnya dituliskan
sebagai berikut:
Populasi:
Y = A + B1X1 + B2X2 + B3X3 + ………+ BnXn + e
Atau
Y = B0 + B1X1 + B2X2 + B3X3 + ………+ BnXn + e
Sampel
: Y = a + b1X1 + b 2X2 + b 3X3 + ………+ b nXn + e
Atau
Y = b0 + b1X1 + b 2X2 + b 3X3 + ………+ bnXn + e
Perlu diingat bahwa penulisan model sangat beragam. Hal ini dapat
dimengerti karena penulisan model sendiri hanya bertujuan sebagai teknik
anotasi untuk memudahkan interpretasi. Penulisan cara di atas adalah bentuk
model yang sering dijumpai dalam
beberapa
literatur. Notasi model seperti itu tentu berbeda dengan notasi model Yale.
Apabila kita ingin menganalisis pengaruh Budep dan Kurs terhadap Inflasi dengan
mengacu model Yale, maka notasi model menjadi
seperti
berikut:
Populasi:
Y = B1.23 + B12.3X2i + B13.2X3i + e
Sampel
: Y = b1.23 + b12.3X2i + b13.2X3i + e
Notasi model Yale ini mempunyai spesifikasi dalam menandai
variabel terikat yang selalu dengan angka 1. Untuk variabel bebas notasinya
dimulai dari angka 2, 3, 4, dan seterusnya.Notasi b1.23 berarti
nilai perkiraan Y kalau X2 dan X3 masing-masing sama dengan 0 (nol).
Notasi
b12.3 berarti besarnya pengaruh X2 terhadap
Y jika X3 tetap.
Notasi
b13..2 berarti besarnya pengaruh X3 terhadap
Y jika X2 tetap.
Penulisan
model dengan simbol Y untuk variabel dependen, dan X untuk variabel independen,
saat ini mulai ada penyederhanaan lagi, yang intinya untuk
semakin memudahkan interpretasi. Berdasar pada keinginan
mempermudah dalam mengingat variabel yang akan dibahas, maka notasi model dapat
pula ditulis sebagai berikut:
Inflasi
= b0 + b1Budep + b2 Kurs +
Penulisan dengan gaya seperti ini ternyata sekarang lebih disukai
oleh penulis-penulis saat ini, karena memberikan kemudahan bagi para pembacanya
untuk tidak mengingatingat arti dari simbol X yang dituliskan, tetapi cukup dengan
melihat nama variabelnya. Dengan pertimbangan tersebut maka cara ini nanti juga
akan banyak digunakan dalam pembahasan selanjutnya.
Penghitungan
Nilai Parameter
Penggunaan metode OLS dalam regresi linier berganda dimaksudkan
untuk mendapatkan aturan dalam mengestimasi parameter yang tidak diketahui.
Prinsip yang terkandung dalam OLS sendiri adalah untuk meminimalisasi perbedaan
jumlah kuadrat kesalahan (aum of square) antara nilai observasi Y
dengan Yˆ . Untuk mendapatkan estimasi least square b0, b1,b2 minimum,
dapat dilakukan melalui cara turunan parsial (partially differentiate) Jadikan
nilai-nilai turunan parsial di atas menjadi sama dengan 0 (nol) Untuk
menyederhanakan rumus paling atas dilakukan pembagian dengan n, Telah
dikemukaan di atas bahwa pencarian nilai b pada single linier berbeda
dengan multiple linier. Perbedaan ini muncul karena jumlah variabel
penjelasnya bertambah. Semakin banyaknya variabel X ini maka kemungkinan-kemungkinan
yang menjelaskan model juga mengalami pertambahan. Dalam single linier kemungkinan
perubahan variabel lain tidak terjadi, tetapi dalam multiple linier hal
itu terjadi. Misalnya, Jika terjadi perubahan pada X1,
meskipun X2 konstan, akan mampu merubah nilai harapan dari Y.
Begitu pula, perubahan pada X2,
meskipun X1 konstan, akan mampu merubah nilai harapan dari Y. Perubahan yang
terjadi pada X1 atau X2 tentu mengakibatkan perubahan nilai harapan Y atau E(Y/X1,X2)
yang berbeda. Oleh karena itu pencarian nilai b mengalami perubahan. Guna
mengetahui seberapa besar kontribusi X1 terhadap
perubahan Y, tentu perlu untuk melakukan kontrol pengaruh dari X2.
Begitu pula, untuk mengetahui kontribusi X2, maka
perlu juga melakukan kontrol terhadap X1.
Dari sini dapat timbul pertanyaan, bagaimana caranya mengontrolnya? Untuk
menjawabnya, perlu ilustrasi secara konkrit agar mudah dipahami. Misalnya kita
hendak mengontrol pengaruh linier X2 ketika
melakukan pengukuran dampak dari perubahan X1
terhadap Y, maka dapat melakukan langkah-langkah sebagai berikut:
Tahap
pertama: lakukan regresi Y terhadap X2.
Y =
b0 + b2 X2 + e1
Dimana
e1 merupakan residual, yang besarnya:
e1 = Y
– b0 – b2X2 = Y-Yˆ
Tahap
kedua: lakukan regresi X1 terhadap
X2.
X1 = b0 + b2 X2 + e2
Dimana
e1 merupakan residual, yang besarnya:
e2 = X1 – b0 – b2X2
= X1-Xˆ
Tahap
ketiga: lakukan regresi e1 terhadap e2
e1 = a0 + a1e2 +e3
Besarnya a1 pada tahap ketiga inilah yang merupakan nilai pasti atau net
effect dari perubahan satu unit X1 terhadap
Y, atau menunjukkan kemiringan (slope) garis Y atas variabel X1. Logika
dari teori tersebut yang mendasari rumus yang dapat digunakan untuk menentukan
koefisien regresi parsial (partial regression coefficients) (baca: b1, b2). Dengan
memanfaatkan data yang telah tersedia, kita dapat pula menentukan nilai b1 variabel
Budep maupun b2 Nilai
dari parameter b1 dan b2 merupakan nilai dari suatu sampel. Nilai b1 dan
b2 tergantung pada jumlah sampel yang ditarik. Penambahan atau
pengurangan akan mengakibatkan perubahan rentangan nilai b. Perubahan rentang
nilai b1 dan b2 diukur dengan standar error. Semakin besar standar error
mencerminkan nilai b sebagai penduga populasi semakin kurang representatif.
Sebaliknya, semakin kecil standar error maka keakuratan daya penduga
nilai b terhadap populasi semakin tinggi.
Perbandingan antara nilai b dan standar error ini memunculkan
nilai t Kita masih memerlukan lagi angka untuk mengisi rumus e2 .
Untuk dapat mengisi rumus tersebut, perlu terlebih dulu mencari nilai e. Nilai
e adalah standar error yang terdapat dalam persamaan regresi. Perhatikan
persamaan regresi:
Y =
b0 + b1X1 + b2 X2 + e
atau
Inflasi
= b0 + b1Budep + b2 Kurs + e
Secara matematis, dari persamaan regresi di atas nilai e dapat
diperoleh, dengan cara mengubah posisi tanda persamaan hingga menjadi:
eY-
(b0 + b1X1 + b2 X2)
Bantuan
dengan SPSS
Tahapan-tahan yang dilalui untuk melakukan regresi linier berganda
dengan penghitungan-penghitungan nilai a, b, Sb di
atas, dapat dilakukan dengan bantuan SPSS dengan tahapan sebagai berikut:
·
Pastikan data SPSS sudah siap
·
Lakukan regresi, caranya: pilih Analyze, Reression, Linear
·
Masukkan variabel Y ke kotak variabel dependen, dan variabel X1
dan X2 ke kotak variabel Independen, kemudian klik OK.
·
Hasil regresi akan tampak dalam output regression yang menunjukkan
tabel: model summary (memuat R2), ANOVA (memuat nilai F),
Coefficient (memuat nilai t).
Koefisien
Determinasi (R2)
Disamping menguji signifikansi dari masing-masing variabel, kita
dapat pula menguji determinasi seluruh variabel penjelas yang ada dalam model
regresi. Pengujian ini biasanya disimbolkan dengan koefisien regresi yang biasa
disimbolkan dengan R2. Uraian tentang koefisien determinasi sedikit banyak telah
disinggung pada single linier regression. Pada sub bahasan ini hanya
menambah penjelasan penjelasan agar menjadi lebih lengkap saja. Koefisien determinasi
pada dasarnya digunakan untuk mengkur goodness of fit dari persamaan
regresi, melalui hasil pengukuran dalam bentuk prosentase yang menjelaskan
determinasi variabel penjelas (X) terhadap variabel yang dijelaskan (Y).
Koefisien determinasi dapat dicari melalui hasil bagi dari total sum of
square (TSS) atau total variasi Y terhadap explained sum of square
(ESS)
atau variasi yang dijelaskan Y. Dengan demikian kita dapat mendefinisikan lagi
R2 dengan arti rasio antara variasi yang dijelaskan Y dengan total
variasi Y. dimana:
Yˆ (baca:
Y cap) adalah nilai perkiraan Y atau estimasi garis regresi. Y (baca:
Y bar) adalah nilai Y rata-rata. Y cap diperoleh dengan cara
menghitung hasil regresi dengan memasukkan nilai parameter dan data variabel.
Penghitungan nilai Y cap menjadi penting untuk dilakukan
agar mempermudah kita dalam menggunakan rumus R2 yang
telah ditentukan di atas. Sebagai contoh menghitung Y cap, berikut ini dihitung
nilai Y cap pada observasi 1. menunjukkan arti bahwa determinasi
variabel Budep (X1) dan Kurs (X2) dalam mempengaruhi inflasi (Y) adalah sebesar 75,1%. Nilai sebesar
ini mengindikasikan bahwa model yang digunakan dalam menjelaskan variabel Y
cukup baik, karena mencapai 75,1%. Sisanya sebesar 24,1% dijelaskan oleh
variabel lain yang tidak dijelaskan dalam model.
Uji
F
Seperti telah dikemukakan di atas, bahwa dalam regresi linier
berganda variabel penjelasnya selalu berjumlah lebih dari satu. Untuk itu, maka
pengujian tingkat signifikansi variabel tidak hanya dilakukan secara individual
saja, seperti dilakukan dengan uji t, tetapi dapat pula dilakukan pengujian
signifikansi semua variabel penjelas secara serentak atau bersama-sama.
Pengujian secara serentak tersebut dilakukan dengan teknik analisis of
variance (ANOVA) melalui pengujian nilai F hitung yang dibandingkan dengan
nilai F tabel. Oleh karena itu disebut pula dengan uji F. Pada prinsipnya,
teknik ANOVA digunakan untuk menguji distribusi atau variansi means dalam
variabel penjelas apakah secara proporsional telah signifikan menjelaskan
variasi dari variabel yang dijelaskan.
Untuk memastikan jawabannya, maka perlu dihitung rasio antara variansi
means (variance between means) yang dibandingkan dengan variansi di
dalam kelompok variabel (variance between group). Hasil pembandingan keduanya
itu (rasio antara variance between Mans terhadap variance between
group) menghasilkan nilai F hitung, yang kemudian dibandingkan dengan nilai
F tabel. Jika nilai F hitung lebih besar dibanding nilai F tabel, maka secara
serentak seluruh variabel penjelas yang ada dalam model signifikan mempengaruhi
variabel terikat Y.
Sebaliknya, jika nilai F hitung lebih kecil dibandingkan dengan
nilai F tabel, maka tidak secara serentak seluruh variabel penjelas yang ada
dalam model signifikan mempengaruhi variabel terikat Y.
Atau
secara ringkas dapat dituliskan sebagai berikut:
;(k
1);(n k ) F F berarti tidak signifikan atau H0 diterima
;(k
1);(n k ) F F berarti signifikan atau H0 ditolak
H0 diterima atau ditolak, adalah merupakan satu keputusan jawaban
terhadap hipotesis yang terkait dengan uji F, yang biasanya dituliskan dalam
kalimat sebagai berikut:
H0 : b1 = b2 = 0
Variabel penjelas secara serentak tidak signifikan mempengaruhi variabel yang dijelaskan.
H0 : b1 b2 0 Variabel
penjelas secara serentak signifikan mempengaruhi variabel yang dijelaskan.
Karena uji F adalah membandingkan antara nilai F hitung dengan
nilai F tabel, maka penting untuk mengetahui bagaimana
mencari nilai F hitung ataupun nilai F tabel. Sedangkan
nilai F tabel telah ditentukan dalam tabel. Yang
penting untuk diketahui adalah bagaimana cara membaca
tabelnya. Seperti yang telah dituliskan pada pembandingan
antara nilai F hitung dan nilai F tabel di atas,
diketahui bahwa F tabel dituliskan F;k-1; (n-k).
Arti
dari tulisan tersebut adalah:
Simbol
menjelaskan tingkat signifikansi (level of significance) (apakah pada 0,05
atau 0,01 ataukah 0,10, dan seterusnya).
Simbol
(k-1) menunjukkan degrees of freedom for numerator.
Simbol
(n-k) menunjukkan degrees of freedom for denominator.
2. Pada regresi linear berganda
variabel X yang digunakan berjumlah lebih dari satu dan merupakan pengembangan
dari model regresi linear tunggal. Penulisan model variabel dependen dengan
simbol Y dan variabel independen dengan simbol X mulai ada penyederhanaan lagi
yang intinya untuk memudahkan interpretasi. Prinisp penggunan metode OLS
dalam regresi linear berganda adalah untuk meminimalisasi perbedaan
jumlah kuadrat kesalahan. Disamping menguji signifikansi dengan uji t dari
masing-masing variabel , dapat pula menguji determinasi seluruh variabel
penjelas yang ada dalam model regresindan disimbolkan dengan koefisien
regresi (R
2
). Selain itu pengujian secara serentak dengan menggunakan teknik ANOVA
melalui pengujian nilai F hitung yang dibandingkan dengan nilai F tabel.
Tugas:
1.
Buatlah rangkuman dari pembahasan di atas!
2.
Cobalah untuk menyimpulkan maksud dari uraian
bab
ini!
3.
Lakukanlah perintah-perintah di bawah ini:
a.
Coba jelaskan apa yang dimaksud dengan regresi linier berganda!
Analisis
regresi linier berganda adalah hubungan secara linear antara dua atau lebih
variabel independen (X1, X2,….Xn) dengan
variabel dependen (Y).
b.
Coba tuliskan model regresi linier berganda!
Populasi: Y = A + B1X1 + B2X2
+ B3X3 + ………+ BnXn + e
Atau Y =
B0 +
B1X1 + B2X2 + B3X3
+ ………+ BnXn + e
Sampel
: Y = a + b1X1 + b 2X2 + b 3X3 +
………+ b nXn+ e
Atau Y = b0 + b1X1
+ b 2X2 + b 3X3 + ………+ bnXn + e
c.
Coba uraikan arti dari notasi atas model yang telah anda tuliskan!
d.
Jelaskan informasi apa yang dapat diungkap pada konstanta!
e.
Jelaskan informasi apa yang dapat diung kappada koefisien regresi!
f.
Coba sebutkan perbedaan-perbedaan antara model regresi linier
sederhana dengan model regresi linier berganda!
Regresi linier berganda banyak
sekali digunakan dalam berbagai penulisan laporan penelitian ilmiah. Bahkan,
bisa jadi, analisis regresi linier berganda ini menjadi yang paling banyak
digunakan. Analisis regresi menunjukkan pengaruh variabel independen atau
variabel bebas (X) terhadap variabel dependen atau variabel tergantung (Y).
Dengan demikian, setidaknya ada 2 variabel yang terlibat dalam uji atau
analisis regresi yaitu 1). variabel independen atau variabel bebas (X), dan 2)
variabel dependen atau variabel tergantung (Y).
Analisis regresi linier sederhana
adalah analisis regresi yang hanya melibatkan dua variabel saja, yaitu 1 (satu)
variabel dependen atau variabel tergantung dan 1 (satu) variabel independen
atau variabel bebas.
g.
Jelaskan mengapa rumus untuk mencari nilai b pada model regresi
linier berganda berbeda dengan model regresi linier sederhana!
Analisis regresi dipergunakan
untuk menggambarkan garis yang menunjukan arah hubungan antar variabel, serta
dipergunakan untuk melakukan prediksi. sedangkan regresi yang variabel bebasnya
lebih dari satu disebut regresi berganda (Multiple regression/multivariate
regression), yang dapat terdiri dari dua prediktor (regresi ganda) maupun
lebih.
h.
Coba jelaskan apakah pencarian nilai t juga mengalami perubahan!
kenapa?
Pencarian
nilai t mempunyai kesamaan dengan model regresi linear sederhana, hanya saja
pencarian Sb nya yang berbeda.
i.
Coba uraikan bagaimana menentukan nilai t yang signifikan!
Untuk mengetahui
signifikan atau tidak nilai t hitung tersebut, maka perlu membandingkan dengan nilai t tabel. Apabila nilai t
hitung lebih besar dibandingkan dengan
nilai t tabel, maka variabel penjelas tersebut signifikan. Sebaliknya, jika
nilai t hitung lebih kecil dari t tabel
maka variabel penjelas tersebut tidak signifikan.
j.
Jelaskan apa kegunaan nilai F!
Nilai F digunakan
untuk mengetahui
signifikan atau tidaknya variabel yaitu dengan memandingkan
antara nilai F hitung dengan nilai F tabel.
k.
Bagaimana menentukan nilai F yang signifikan?
Jika nilai F hitung
lebih besar dibanding nilai F tabel, maka secara serentak seluruh variabel penjelas yang ada dalam model signifikan
mempengaruhi variabel terikat Y. Jika
nilai F hitung lebih kecil dibandingkan dengan nilai F tabel, maka tidak secara
serentak seluruh variabel penjelas yang
ada dalam model signifikan mempengaruhi variabel terikat Y.
l.
Jelaskan apakah rumus dalam mencari koefisien determinasi pada
model regresi linier berganda berbeda dengan regresi linier sederhana! kenapa?
Sama. Karena,
koefisien determinasi pada dasarnya digunakan untuk mengukur goodness of fit dari persamaan regresi melalui hasil
pengukuran dalam bentuk prosentase yang menjelaskan determinasi
variabel penjelas (X) terhadap variabel yang dijelaskan (Y).
m.
Jelaskan bagaimana variabel penjelas dapat dianggap sebagai
prediktor terbaik dalam menjelaskan Y!
Variabel penjelas dapat dianggap
sebagai prediktor terbaik dalam menjelaskan Y karena tingkat signifikansi
variabel tidak hanya dilakukan secara individual saja tetapi juga dilakukan
pengujian
seacara serentak guna menjelaskan apakah telah signifikan dalam menjelaskan
variasi dari variabel yang dijelaskan.
Supawi Pawenang, 2017, Modul Ekonometrika, Fakultas Ekonomi, UNIBA Surakarta
https://uniba.ac.id/utama/
http://supawi-pawenang.blogspot.co.id/
Komentar
Posting Komentar