Analisis Regresi Linear Berganda Dengan SPSS Metode Enter VS Stepwise

Portal-Statistik | Selamat malam blogger Indonesia, pada kesempatan kali ini, saya ingin berbagi kepada anda dan kita semua tentang Analisis Regresi Linear Berganda Dengan SPSS Metode Enter VS Stepwise, supaya kita bisa sharing dan berbagi pengalaman terkait bidang analisis data, jika terdapat kesalahan dalam penyampaian atau penyajian saya mohon dikoreksi karena saya juga sedang belajar :)
Baiklah kita mulai saja postingan dimalam yang sepi dan sunyi ini hehe..

Regresi linear berganda/majemuk digunakan untuk memodelkan hubungan Antara variabel dependent (terikat) dengan variabel independent (bebas), dengan jumlah variabel independent lebih dari satu.
Secara umum, analisis regresi pada dasarnya adalah studi mengenai ketergantungan variabel dependent (terikat) dengan satu atau lebih variabel independent (bebas) dengan tujuan untuk mengestimasi dan atau memprediksi rata-rata populasi atau nilai rata-rata variabel dependent berdasarkan nilai variabel independent yang diketahui (Gujarati, 2003).
Y’ = a + b1X1+ b2X2+…..+ bnXn + e
Keterangan:
Y’                   =   Variabel dependen (nilai yang diprediksikan)
X1 dan X2      =   Variabel independen
a                     =   Konstanta (nilai Y’ apabila X1, X2…..Xn = 0)
b                     =   Koefisien regresi (nilai peningkatan ataupun penurunan)

Studi Kasus...
Data Jumlah Penduduk Miskin dan Faktor-faktor Penyebabnya
pada setiap Kabupaten/Kota di Provinsi Jawa Timur


NOJumlah Penduduk Miskin (Ribu Jiwa) Laju Pertumbuhan Ekonomi (%) Jumlah Pengangguran (Jiwa) Angka Rata-rata Lama Sekolah (Tahun)
1105.46.5230316.79
21136.13188986.73
3107.86.183127.32
4105.46.82190217.99
5135.56.81132767.41
6232.86.53286347.61
7306.76.22564256.86
8140.85.92154596.1
9311.46.16314726.65
10175.16.63324156.91
11131.95.646455.6
12105.25.62112896.17
13276.66.4612195.15
14199.36.76276786.4
15145.46.19836039.87
16125.46.81263817.93
17166.46.31321757.87
18151.66.75183647.21
19102.35.92192827.07
2080.25.8392177.62
21149.16.19214766.43
22227.212.26207236.65
23225.86.62171166.36
24220.56.9216157.12
25193.86.93451998.63
26255.65.44250085.19
27285.45.3378684.03
28179.25.84154715.81
29256.65.73113435.31
3024.95.91992310.19
3110.16.3343719.84
3248.46.523408511.12
3341.46.0454448.46
34168.86.3359568.9
358.96.5646239.76
3610.46.92834210.5
37195.67.08913910.01
389.77.0654188.44

Dapatkan model terbaik untuk memprediksi jumlah penduduk miskin pada provinsi tersebut beserta interpretasinya. !

Baiklah, langsung saja kita mulai langkah-langkah analisis regresi berganda dengan SPSS:

  1. Buka aplikasi SPSS, dalam hal ini saya menggunakan SPSS versi 22. Buat nama variabel sesuai dengan studi kasus, pada contoh diatas, nama variabel adalah: Jum_Pend_Misk, Laju_Pert_Ekonomi, Jum_Peng, AngkaRata2LamaSklh.
  2. Setalah itu, analisis regresi kita mulai. Klik menu Analyze - Regression – Linear, kemudian masukkan variabel dependent Jumlah Penduduk Miskin ke dalam kotak Dependent, dan variabel Laju Pertumbuhan Ekonomi, Jumlah Pengangguran dan Angka Rata-Rata Lama Sekolah ke dalam kotak Independent. Kemudian pilih Metode Enter (nanti kita bandingkan hasil outputnya dengan metode stepwise :D ).
    Selanjutnya Klik button Statistics dan berikan centang seperti gambar dibawah ini, klik Continue dan OK.
Mari kita lihat bagaimana outputnya.

Pertama yang mau saya soroti adalah output Coefficients
Seperti gambar dibawah ini output coefficient tidak signifikan jika dilihat dari uji partial artinya variabel Laju Pertumbuhan Ekonomi dalam hal ini tidak signifikan karena nilai Sig > alpha = 0.198 > 0.05, karena variable ini tidak signifikan / tidak valid / tidak sesuai maka yang harus kita lakukan adalah mengeluarkannya dari model atau persamaan yang kita punya.
Lakukan Analisis Regresi Lagi, ulangi langkah 2, dan keluarkan variabel Laju Pertumbuhan Ekonomi. Seperti Gambar Diwah ini. Sehingga kita hanya memiliki 2 variabel bebas saja.

Ok. Sekarang Mari kita lihat outputnya secara keseluruhan...
Output 1 – Model Summary

Koefisien Korelasi (R)
Analisis Korelasi bertujuan untuk mengukut kekuatan asosiasi (hubungan) linear Antara dua variabel atau lebih, korelasi tidak menunjukkan hubungan fungsional atau dengan kata lain analisis korelasi tidak membedakan antara variabel dependent dengan variabel independent.
Besarnya koefesien korelasi berkisar antara +1 s/d -1. Koefesien korelasi menunjukkan kekuatan (strength) hubungan linear dan arah hubungan dua variabel acak. Jika koefesien korelasi positif, maka kedua variabel mempunyai hubungan searah. Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan tinggi pula. Sebaliknya, jika koefesien korelasi negatif, maka kedua variabel mempunyai hubungan terbalik. Artinya jika nilai variabel X tinggi, maka nilai variabel Y akan menjadi rendah (dan sebaliknya). Untuk memudahkan melakukan interpretasi mengenai kekuatan hubungan antara dua variabel penulis memberikan kriteria sebagai berikut (Sarwono:2006):
  • 0 : Tidak ada korelasi antara dua variabe
  • 0 – 0,25: Korelasi sangat lemah
  • 0,25 – 0,5: Korelasi cukup
  • 0,5 – 0,75: Korelasi  kuat
  • 0,75 – 0,99: Korelasi  sangat kuat
  • 1: Korelasi sempurna

Dari output Model Summary diatas terlihat bahwa nilai R (koefisien korelasi) sebesar 0.776, yang berarti bahwa variabel dependent dan independent dapat dikategorikan memiliki hubungan linear yang sangat kuat.

Koefisien Determinasi (R Square)
Koefisien Determinasi pada intinya mengukur seberapa jauh kemampuan model dalam menerangkan variasi variabel dependent. Nilai koefisien determinasi adalah dari 0 – 1.

Kelemahan mendasar penggunaan koefisien determinasi adalah bias terhadap jumlah variabel independent yang dimasukkan kedalam model. Setiap tambahan satu variabel independent, maka R Square pasti meningkat, tidak peduli apakah variabel tersebut berpengaruh secara signifikan terhadap variabel dependent. Oleh karena itu banyak peneliti menganjurkan untuk menggunakan nilai Adjusted R Square saat mengevaluasi mana model regresi terbaik. Tidak seperti R Square, nilai Adjusted R Square dapat naik / turun apabila satu variabel independent ditambahkan kedalam model.

Dalam kenyataan nilai Adjusted R Square dapat bernilai negative, walaupun yang dikehendaki harus bernilai positif. Menuru Gujarati (2003), jika dalam Uji empiris didapat nilai Adjusted R Square negative, maka nilai Adjusted R Square dianggap bernilai nol. Secara matematis jika nilai R Square = 1, maka Adjusted R Square = R Square = 1 sedangkan jika nilai R Square = 0, maka Adjusted R Square= (1-k)/(n-k). Jika k > 1, maka Adjusted R Square akan bernilai negative.

Berdasarkan gambar diperoleh angka Adjusted R Square sebesar 0,579 atau 57,9%. Hal ini menunjukkan bahwa Jumlah Pengangguran dan Angka Rata-Rata Lama Sekolah berpengaruh sebesar 57,9% terhadap Jumlah Penduduk Miskin di Jawa Timur sedangkan sisanya sebesar 42,1% dipengaruhi oleh variabel atau faktor lain diluar penelitian.
Std. Error of the Estimate (SEE) sebesar 55,79. Makin kecil nilai SEE akan membuat model regresi semakin tepat dalam memprediksi variabel dependent.

Uji Simultan / Overall / Serentak / Uji Statistik F
Uji Statistik F pada dasarnya menunjukkan apakah semua variabel independent atau bebas yang dimasukkan dalam model mempunyai pengaruh secara bersama-sama terhadap variabel dependent/terikat. Atau untuk mengetahui apakah model regresi dapat digunakan untuk memprediksi variabel dependen atau tidak. Signifikan berarti hubungan yang terjadi dapat berlaku untuk populasi (dapat digeneralisasikan)
Uji Simultan atau Overall ini dapat dilakukan dengan melihat nilai Sig (p-value) atau membandingkan Fhitung dengan Ftabel.
Mungkin ada yang masih bingung bagaimanan membaca tabel F, Silahkan lihat postingan tentang Cara mencari nilai F tabel.
  • Hipotesis
    Ho : β =  0 (model regresi Y terhadap Xi tidak signifikan/tidak berarti/tidak sesuai)
    H1 : β ≠  0 (model regresi Y terhadap Xi signifikan/memiliki arti/sesuai)
  • Tingkat Signifikansi:
    α=0.05
  • Daerah Kritis:
    Fhit > Ftab : Tolak H0
    Sig. ≤ α : Tolak H0
  • Statistika Uji:
    Fhitung = 352.274 Sig. = 0.000
    Ftabel = 4.84 (lihat tabel F)
  • Keputusan Uji
    Karena nilai Fhitung > Ftabel dan Sig. < 0.05 maka keputusannya adalah tolak H0
  • Kesimpulan :
    Jadi dengan tingkat signifikansi 5% didapatkan kesimpulan bahwa model regresi Y terhadap Xi adalah sesuai atau memiliki arti.
Uji Parsial / Uji Signifikansi Parameter Individual (Uji Statistik t)
Uji statistic t pada dasarnya menunjukkan seberapa jauh pengaruh satu vaiabel penjelas / independent secara individual/satu-satu dalam menerangkan variasi variabel dependent.
Untuk melakukan uji parsial atau uji koefisien regresi atau uji sendiri-sendiri dilakukan untuk mengetahui variabel tersebut signifikan atau tidak terhadap model regresi yang didapatkan, uji parsial ini dapat dilakukan dengan melihat Sig (p-value) atau membandingkan Thitung dengan Ttabel. Dalam hal ini saya gunakan Sig. atau P-value, jika teman-teman ingin membandingkan dengan T tabel juga silahkan, nanti hasilnya juga sama. Bagi yang masih bingung bagaimana  cara mencari nilai T tabel, Silahkan lihat postingan tentang Cara mencari nilai T tabel.

Uji Konstanta
  • Hipotesis
    Ho : β =  0 (konstanta tidak signifikan / tidak valid)
    H1 : β ≠  0 (konstanta signifikan / valid)
  • Tingkat Signifikansi:
    α=0.05
  • Daerah Kritis:
    P_value≤ α : Tolak H0
  • Statistika Uji:
    α = 0,05
    Pvalue = 0.000
  • Keputusan Uji
    Karena nilai Pvalue < α maka keputusannya adalah tolak H0
  • Kesimpulan :
    Jadi dengan tingkat signifikansi 5% didapatkan kesimpulan bahwa konstanta model regresi adalah signifikan.

Uji Koefisien Regresi X1 (Jumlah Pengangguran)
  • Hipotesis
    Ho : β =  0 (koefisien regresi X1 tidak signifikan / tidak valid)
    H1 : β ≠  0 (koefisien regresi X1 signifikan / valid)
  • Tingkat Signifikansi:
    α=0.05
  • Daerah Kritis:
    P_value≤ α : Tolak H0
  • Statistika Uji:
    α = 0,05
    Pvalue = 0.000
  • Keputusan Uji
    Karena nilai Pvalue < α maka keputusannya adalah tolak H0
  • Kesimpulan :
    Jadi dengan tingkat signifikansi 5% didapatkan kesimpulan bahwa koefisien regresi X1 adalah signifikan.
Silahkan lakukan hal yang sama ke variabel yang lain, dilanjutkan sendiri yaa :D sampai semua variabelnya signifikan :)

Sehingga didapatkan model yaitu:
Y = 382,072 + 0,02X1 – 36,763X2 
Y : Jumlah Penduduk Miskin
X1 : Jumlah Pengangguran
X2 : Angka Rata-Rata Lama Sekolah

Interpretasi:

  1. Nilai konstanta sebesar 382,072. Hal ini berarti bahwa jika Jumlah Pengangguran dan Angka Rata-Rata Lama Sekolah tetap atau tidak mengalami penambahan atau pengurangan, maka Jumlah Pengangguran sebesar nilai konstanta yaitu 382,072 (dalam ribu).
  2. Nilai koefisien Jumlah Pengangguran untuk variabel X1 sebesar 0,02. Hal ini mengandung arti bahwa setiap kenaikan Jumlah Pengangguran satu satuan maka variabel Jumlah Penduduk Miskin (Y) akan naik sebesar 0,002 dengan asumsi bahwa variabel bebas yang lain dari model regresi adalah tetap.
  3. Nilai koefisien Angka Rata-Rata Lama Sekolah untuk variabel X2 sebesar 36,763 dan bertanda negatif, ini menunjukkan bahwa Angka Rata-Rata Lama Sekolah mempunyai hubungan yang berlawanan arah dengan variabel Jumlah penduduk Miskin. Hal ini mengandung arti bahwa setiap kenaikan Angka Rata-Rata Lama Sekolah satu satuan maka variabel Jumlah Penduduk Miskin (Y) akan turun sebesar 36,763 dengan asumsi bahwa variabel bebas yang lain dari model regresi adalah tetap.

Model regresi akan dapat dijadikan alat estimasi yang baik dan tidak bias jika telah memenuhi persyaratan BLUE (best linear unbiased estimator), dengan melakukan beberapa uji asumsi yaitu asumsi residual berdistribusi normal, multikolinearitas, heteroskedastitas, dan autokorelasi.
Silahkan simak postingan tentang Uji asumsi klasik pada regresi linear berganda.

O Yaa,, hampir lupa, sesuai judul diataskan dengan Metode Enter VS Stepwise
Metode ENTER
Metode enter adalah memasukkan semua prediktor ke dalam analisis sekaligus. Maksudnya Semua prediktor dimasukkan secara simultan dan langsung bias dibentuk model tanpa melihat masing-masing variabel itu signifikan atau tidak, kemudian variabel yang tidak signifikan dikeluarkan satu persatu kemudian di uji analisis regresi lagi.
Perhatikan gambar dibawah ini untuk melihat bagaimana cara kerjanya.

Metode STEPWISE
Metode stepwise adalah memasukkan prediktor secara bertahap berdasarkan nilai F yang signifkan (sig F di bawah 0.05). Setelah dimasukkan lalu dikeluarkan lagi. Proses memasukkan dikombinasikan dengan mengeliminasi prediktor yang tidak signifikan. Atau dengan kata lain kita sudah langsung bisa mendapatkan hasil yang signifikan dari model yang dikeluarkannya.
Perhatikan gambar dibawah ini untuk melihat bagaimana cara kerjanya.


Alhamdulillah, selesai juga nih postingan, lumayan panjang dan mata sudah mulai 5 watt (ngantuuk).
Ok,,, sekian dulu yaa. Jika terdapat kesalahan mohon dikoreksi, jika masih ada yang belum paham silahkan ditanyakan.
Silahkan Bisa dibaca juga postingan lengkap Uji Asumsi Klasik Pada Regresi Linear

Semoga Bermanfaat.
Have FUN.
41 Komentar untuk "Analisis Regresi Linear Berganda Dengan SPSS Metode Enter VS Stepwise"

mantap gan, izin praktekin, baca juga : http://www.blogsiryan.com/2014/05/cara-membuat-blog-menjadi-seo-friendly.html

wah matep banget gan nice post gan :D

Wow... Ini keren banget om aplikasinya, penjelasannya juga sangat mudah untuk dipahami, sepertinya cocok buat aplikasi di BPS nih...

udah baca-baca sampe bawah ternyata yang nulis temen sendiri. tau gitu minta ajarin aja langsung , bzz -.-

sama-sama gan,, semoga bermanfaar :)

haha,, gak tau juga gan,, itu data dari BPS Jatim

silahkan dipelajari lagi gan :D

BPS juga gunakan aplikasi ini gan :D

hahaha,,, pengetahuan kita sama aja tentang beginiaa,,, :D
thanks atas kunjungannya Dian... :D

terima kasih untuk postinganx, sangat membantu.. sukses selalu sobat..

ok,, sama-sama, semoga bermanfaat.

Izin pek ilmu ny gan.............

Password untuk liat tabel F apa ya bro???

di komentar samping file winrarnya sudah ada mbak.
portal-statistik

makasih banyak yaa blog ini membantu dalam penulisan tugas akhir saya

Manteb gan infonya,kebetulan ane juga mengambil metode skripsi tentang ini, klo bisa tambahin referensi turotial lain dong gan,semacam ebook ato apalah ,hehehe

terimakasih gan, untuk referensi berupa ebook saya rasa sudah banyak di google heheh. :D

terima kasih atas postingannya:) data jumlah penduduk miskin dan faktor-faktor penyebab Kabupaten/Kota di Provinsi Jawa Timur itu tahun berapa ya?

sama-sama, semoga bermanfaat.
itu data kemiskinan tahun 2013, data dari BPS mbak.

Mas apakah nilai sig. selalu 0,000? kalau hasil 0,03 juga tidak masalah ya? nah kalo hasilnya 0,780 yang lebih besar dari pada 0,05 bagaimana? apakah penelitian ini tidak bisa di lanjut? atau ada saran lain,,, mohon jawabannya ya mas. terimakasih sebelumnya

Nilai sig. pada apa? variabel?
nilai sig, pada variabel dimana sig < alpha(0.05) berarti tolak H0 yaitu model tidak signifikan/tidak sesuai/tidak valid. yang harus dilakukan adalah mengeluarkannya dari model regresi dan mengulang langkah analisis lagi.

Selamat siang gan. Artikelnya sangat membantu. Tp ada hal ganjal yg ingin saya tanyakan. Mengenai jika secara simultan terdapat hasil yang tidak signifikan. Apakah bisa melanjutkan pengujian secara individual gan
?

jika secara simultan saja sudah tidak signifikan pengaruhnya, apalagi jika dilihat secara satu persatu gan.
kalau sudah uji F tidak memenuhi, berarti analisis regresi linear berganda tidak cocok untuk menangani kasus tersebut, ada banyak jenis regresi yang bisa dicoba.
Terimakasih

Maaf gan, kalo saya uji hasilnya terdapat multikolinieritas dan autokorelasi, apa yang harus saya lakukan ya, tolong dibantu.Trims.

TERIMA KASIH, Sangat membantu. saya mau Tanya, jika saya menggunakan variable independen sebanyak 5 variable bagaimana cara menyatukannya agar langsung seperti mas nya di contoh ? apakah perlu satu2 menganalisis setiap variable nya ? terima kasih, mohon jawabannya.

maaf gan mau tanya kalau ada variabel removed itu artinya apa ya dan harus bagaimana? thanks

mau nanya gimana cara mencari rumus model jones modifikasi di spss ya

kk mau tanya dong, sasaran 2 saya kan identifikasi faktor faktor yang mempengaruhi perubahan penggunaan lahan, dari beberapa jurnal yg saya baca semuanya menggunakan metode anlisis Regresi linier berganda dengan bantuan SPSS, tp menurut dosen saya metode itu tidak bisa digunakan karna datanya bukan berupa angka. itu bagaimana yah kk, soalnya saya juga gak terlalu paham. terimakasih

kalo datanya berupa skala ordinal berarti ngambil skor total per indikator ya?

Kalau tes kolmogrov tidak normal digimanain ya

Nilai koefisien variabel saya 0.000 itu kesimpulannya gimana ya pak?? Apakah Ndak berpengaruh ya?? Mohon Jawabannya terimakasih

bang, buat contoh kasusnya yg memiliki 3 variable independent dan 1 variable dependent. yang x1,x2 dan x3 memenuhi syarat

Silahkan tinggalkan komentar, kritik, maupun saran dari sobat blogger tentang apa yang sobat rasakan setelah mengunjungi blog ini.

Back To Top