Analisis Regresi Logistik Biner

Analisis Regresi Logistik Biner

ANALISIS REGRESI LOGISTIK BINER

Analisis regresi logistik biner digunakan untuk menjelaskan hubungan antara variabel respon yang berupa data dikotomik/biner dengan variabel bebas yang berupa data berskala interval dan atau kategorik

Regresi logistik biner (logistic regression) sebenarnya sama dengan analisis regresi berganda, hanya variabel terikatnya merupakan variabel dummy (0 dan 1). Sebagai contoh, pengaruh beberapa rasio keuangan terhadap keterlambatan penyampaian laporan keuangan. Maka variabel terikatnya adalah 0 jika terlambat dan 1 jika tidak terlambat (tepat). Regresi logistik tidak memerlukan asumsi normalitas, meskipun screening data outliers tetap dapat dilakukan.

Asumsi-asumsi dalam regresi logistik biner:

  • Tidak mengasumsikan hubungan linier antar variabel dependen dan independent
  • Variabel dependen harus bersifat dikotomi (2 variabel)
  • Variabel independent tidak harus memiliki keragaman yang sama antar kelompok variabel
  • Kategori dalam variabel independent harus terpisah satu sama lain atau bersifat eksklusif
  • Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50 sampel data untuk sebuah variabel prediktor (bebas).

 

Tidak seperti regresi linier biasa, regresi logistik biner tidak mengasumsikan hubungan antara variabel independen dan dependen secara linier. Regresi logistik biner merupakan regresi non linier dimana model yang ditentukan akan mengikuti pola kurva seperti gambar di bawah ini.

Picture1

Model yang digunakan pada regresi logistik biner adalah:

Log (P / 1 – p) = β0 + β1X1 + β2X2 + …. + βkXk

 

Dimana p adalah kemungkinan bahwa Y = 1, dan X1, X2, X3 adalah variabel independen, dan b adalah koefisien regresi.

Langkah-langkah dalam penggunaan Analisis Regresi Logistik biner adalah:

  1. Uji Signifikansi Model

Untuk mengetahui pengaruh variabel bebas terhadap variabel tidak bebas secara bersama-sama (overall) di dalam model, dapat menggunakan Uji Likelihood Ratio. Hipotesisnya adalah sebagai berikut:
Ho: β1 = β2 =….= βp = 0 (tidak ada pengaruh veriabel bebas secara simultan terhadap variabel tak bebas)
H1: minimal ada satu βj ≠ 0 (ada pengaruh paling sedikit satu veriabel bebas terhadap variabel tak bebas)
Untuk j = 1,2,…,p
Statistik uji yang digunakan adalah:

Picture2

Dengan :

Lo = Maksimum Likelihood dari model reduksi (Reduced Model) atau model yang terdiri dari konstanta saja

Lp =  Maksimum Likelihood dari model penuh (Full Model) atau dengan semua variabel bebas.

Statistik G2 ini mengikuti distribusi Khi-kuadrat dengan derajad bebas p sehingga hipotesis ditolak jika p-value < α, yang berarti variabel bebas X secara bersama-sama mempengaruhi variabel tak bebas Y.

Uji Parsial dan Pembentukan Model

Pada umumnya, tujuan analsis statistik adalah untuk mencari model yang cocok dan keterpautan yang kuat antara model dengan data yang ada. Pengujian keberartian parameter (koefisien β) secara parsial dapat dilakukan melalui Uji Wald dengan hipotesisnya sebagai berikut:

Ho: βj = 0 (variabel bebas ke j tidak mempunyai pengaruh secara signifikan terhadap variabel tidak bebas

H1: βj ≠ 0 (variabel bebas ke j mempunyai pengaruh secara signifikan terhadap variabel tidak bebas)

Untuk j = 1,2,….,p
Dengan statistik uji sebagai berikut:

Picture3

Hipotesis akan ditolak jika p-value < α yang berarti variabel bebas Xj secara partial mempengaruhi variabel tidak bebas Y.

  1. Odds Ratio

Odds ratio merupakan ukuran risiko atau kecenderungan untuk mengalami kejadian ‘sukses’ antara satu kategori dengan kategori lainnya, didefinisikan sebagai ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio ini menyatakan risiko atau kecenderungan pengaruh observasi dengan xj = 1 adalah berapa kali lipat jika dibandingkan dengan observasi dengan xj = 0. Untuk variabel bebas yang berskala kontinyu maka interpretasi dari koefisien βj pada model regresi logistik adalah setiap kenaikan c unit pada variabel bebas akan menyebabkan risiko terjadinya Y = 1, adalah exp(c.βj) kali lebih besar.
Odds ratio dilambangkan dengan θ, didefinisikan sebagai perbandingan dua nilai odds xj = 1 dan xj = 0, sehingga:

Picture4

Regresi logistik biner juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit.

Regresi logistik biner akan membentuk variabel prediktor/respon (log (p/(1-p)) yang merupakan kombinasi linier dari variabel independen. Nilai variabel  prediktor ini kemudian ditransformasikan menjadi probabilitas dengan fungsi logit. Regresi logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai  jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit