Two Stage Least Square dengan Eviews

Two Stage Least Square (2SLS) adalah salah satu metode regresi yang termasuk ke dalam kelompok analisis persamaan struktural. Metode ini merupakan perluasan dari metode OLS yang biasa digunakan dalam perhitungan anlsisi regresi. 2SLS digunakan dalam kondisi dimana terdapat korelasi antara error yang dihasilkan dalam model berkorelasi dengan variabel bebasnya.

Mengapa disebut Two Stage Least Square, karena terdapat tow stage atau dua langkah dan pada dasarnya hanya merupakan perluasan dari metode OLS (Ordinary Least Square).

langkah untuk menyelesaikan persamaan sehingga tidak bias. Langkah pertama adalah dengan menggunakan metode OLS, meregresikan variabel endogen eksplanatori terhadap variabel instrumental variabel dan variabel eksogen lainnya. Hal ini dilakukan untuk mendapatkan variabel eksogen yang tidak bias.

Langkah kedua adalah meregresikan variabel endogen terhadap variabel endogen eksplanatori yang sudah tidak bias bersama bariabel lainnya.

Dalam dunia riil, tentu kita mungkin akan menemukan lebih banyak menemukan model simultan, dimana model tidak hanya mempengaruhi satu arah, tetapi saling mempengaruhi satu sama lain. Variabel endogen tidak mutlak menjadi variabel endogen, begitu juga sebaliknya. Dalam beberapa kondisi dapat menjadi variabel endogen atau variabel eksogen. Katakanlah terdapat persamaan dimana variabel endogennya adalah GDP, sebagai berikut:

Persamaan pertama:

GDP = a0+a1*M2+a2*TBR+a3*GFCF+a4*EMPLOY+e1

Sementara varaibel M2 sendiri adalah variabel endogen dari variabel lainnya seperti persamaan berikut:

Persamaan Kedua:

M2=b0+b1*GDP+b2*TBR+b3*CPI+e2

Persamaan tersebut tentu tidak dapat diselesaikan dengan menggunakan OLS, karena overidentified sehingga akan menghasilkan persamaan yang bias. Dalam hal ini two stage least square mengambil peran.

Pada model TSLS, kita perlu membuat reduce form untuk model di atas. Reduced form adalah persamaan model variabel endogen yang diekspresikan dalam bentuk variabel eksogen dalam persamaan lainnya.

Untuk menyelesaikan persamaan pertama kita perlu memasukan intrumental variabel yang mana adalah: yang perlu diisikan di instrumental list adalah semua variabel pada persamaan reduce form termasuk konstantanya.

untuk persamaan pertama : c TBR CPI GFCF EMPLOY

untuk persamaan kedua: c TBR, GFCF, EMPLOY, CPI

Bagaimana mendeteksi sebuah model adalah persamaan simultan.

1. Secara teoritis

2. Secara empiris

Kita dapat menguji korelasi antara variabel bebas dengan error term (residual). jika terdapat variabel yang memiliki korelasi yang signifikan dengan variabel error maka dapat diduga variabel tersebut dapat diturunkan menjadi persamaan simultan.

Bagaimana mendeteksi sebuah variabel adalah merupakan instrumental variabel

kita dapat menguji korelasi variabel tersebut dengan meregresikan variabel eindependen terdhadap variabel independent yang diduga adalah instrumental variabel beserta variabel lainnya dalam model awa. jika variabel instrumental tersebut memiliki koefisien regresi yang signifikan maka diduga variabel tersebut merupkan instrumental variabel. sementara variabel lainnya tidak mesti signifikan.

Terdapat syarat lain bahwa sebuah variabel dapat dikatakan menjadi instrumental variabel yaitu variabel tersebut tidak boleh behubungan signifikan dengan residual (e) model pertama. Mengujinya tentu tidak sulit, kita hanya perlu meregresikan residual (e) terhadap variabel yang diduga instrumental variabel. Jika koefisien regresinya tidak signifikan, berarti memang variabel tersebut adalah instrumental variabel.

Simulasi Monte Carlo dengan Excel

Definisi Monte Carlo

Simulasi monte carlo adalah sebuah simulasi untuk menentukan suatu angka random dari data sampel dengan berdistribusi tertentu. Tujuan simulasi Monte carlo adalah menemukan nilai yang mendekati nilai sesungguhnya, atau nilai yang akan terjadi berdasarkan distribusi dari data sampling. Oleh sebab kemampuannya mampu memprediksi suatu nilai, maka Monte Carlo dahulu sering digunakan untuk kepentingan judi di kasino.

Dalam dunia keuangan dan perbankan, simulasi Monte carlo tentu sangat dibutuhkan untuk menghitung resiko finansial. Bagi perbankan yang salah satu kegiatan utamanya adalah memberikan kredit kepada nasabah, tentu Monte carlo dibutuhkan untuk memprediksi resiko finansial perbankan akibat kredit macet. Dalam duni investasi, investor dapat memanfaatkan simulasi Monte Carlo untuk mengetahui resiko gagal bayar dari suatu instrumen investasi. Pada dasarnya, dalam dunia keuangan dan perbankan Metode simulasi Monte carlo dapat membantu kita dalam melakukan mitigasi atas resiko.

Prosedur Monte Carlo

1. tentukan angka sampling yang akan disimulasikan

2. temukan distribusi dari data sampling yang ada

3. simulasi berdasarkan distribusi di atas

Bagaimana Melakukan Simulasi Monte Carlo dengan Excel

Saat ini kita dapat melakukan simulasi monte carlo dengan bantuan add ins excel dengan Crystal Ball dari Oracle. Sebagai contoh, seorang aktuaris pada perusahaan asuransi ingin memprediksi tingkat kecelakaan di jalan tol ruas tertentu. Berdasarkan data statistik diketahui sebagai berikut:

Bulan Frekuensi Kecelakaan Bulan Frekuensi Kecelakaan Bulan Frekuensi Kecelakaan
1 9 9 12 17 21
2 8 10 12 18 22
3 43 11 14 19 23
4 12 12 15 20 21
5 16 13 24 21 12
6 32 14 26 22 24
7 13 15 27 23 25
8 4 16 25 24 11

untuk melakukan simulasi terhadap data kecelakaan di atas perlu diketahui apa distribusi dari data di atas. Untuk mengetahuinya kita akan menggunakan add ins crystal ball di excel. Di samping Crystal Ball, masih terdapat software lain yang dapat kita gunakan untuk simulasi monte carlo diantaranya adalah Matlab atau @Risk.

monte carlo 1

Berdasarkan hasil keluaran Excel di atas adalah sebagai berikut:

Distribution Chi-Square Chi-Square P-Value Parameters
Neg Binomial 2.9994 0.083 Probability=0.10643, Shape=2
Geometric 8.3675 0.015 Probability=0.05322
Discrete Uniform 9.5238 0.002 Minimum=2, Maximum=45
Poisson 14.9961 0.001 Rate=18.79167
Binomial 17.0778 0.000 Trials=177, Probability=0.10617

Berikut merupakan summary untuk distribusi Neg binomial:

Data Series: 1
Distribution: 19.
Best Fit: Neg Binomial
Chi-Square 1.7900
P-Value: 0.181

Berdasarkan hasil di atas maka distribusi yang paling fit untuk data di atas adalah distribusi Neg binomial. Selanjutnya distribusi ini yang akan kita jadikan acuan untuk melakukan simulasi dengan menggunakan Monte carlo.

Berikut merupakan langkah-langkah simulasinya:

monte carlo 2

Selanjutnya untuk melihat nilai trial-nya, kita dapat memilih option extract data sesuai kebutuhan.

monte carlo 3

Maka hasil Monte carlo akan diperoleh sebagai berikut:

Trial values Data Series 1: Best Fit
1 34.
2 10.
3 12.
4 21.
5 16.
6 29.
7 23.
8 24.
… …
1000 33.

Tabel di atas menggambarkan hasil untuk simulasi 1000 data. Berdasarkan data di atas maka aktuaris dapat menghitung probabilitas kecelakaan di ruas tol tertentu. Ketika probabilitas kecelakaan sudah diketahui maka tentunya seorang aktuaris dapat menghitung berapa klaim yang harus dibayarkan oleh perusahaan dan berapa premi yang harus dibayarkan oleh nasabah.

Dalam industri perbankan, dengan mengetahui berapa kemungkinan gagal kredit, maka manajemen dapat mengetahui berapa modal yang harus dicadangkan untung memitigasi resiko tersebut. Hal ini dapat juga dimanfaatkan oleh bank sentral, saat ini OJK (Otoritas Jasa Keuangan), untuk membuat kebijakan dalam mengawasi resiko kredit perbankan. Sehingga perbankan harus mencadangkan senilai tertentu untuk resiko kreditnya. Di bidang investasi, ketika seorang investor mengetahui tingkat resiko maksimum dari investasi di instrumen tertentu, maka investor dapat melakukan langkah mitigasi.

Pada dasarnya simulai Monte Carlo dilakukan berdasarkan distribusi sampling tertentu. Kuncinya adalah mengidentifikasi distribusi dari data sampel yang ada. Secara random, dilakukan simulasi terhadap angka-angka sehingga dihasilkan kombinasi yang mendekati distribusi yang paling fit.

Analisis Regresi Sederhana, Ini Penjelasannya

Analisis Regresi Sederhana, Ini Penjelasannya

Analisis Regresi Sederhana adalah sebuah metode pendekatan untuk pemodelan hubungan antara satu variabel dependen dan satu variabel independen. Dalam model regresi, variabel independen menerangkan variabel dependennya. Dalam analisis regresi sederhana, hubungan antara variabel bersifat linier, dimana perubahan pada variabel X akan diikuti oleh perubahan pada variabel Y secara tetap. Sementara pada hubungan non linier, perubahaan variabel X tidak diikuti dengan perubahaan variabel y secara proporsional. seperti pada model kuadratik, perubahan x diikuti oleh kuadrat dari variabel x. Hubungan demikian tidak bersifat linier.

Secara matematis model analisis regresi linier sederhana dapat digambarkan sebagai berikut:

Y = A + BX + e

Y adalah variabel dependen atau respon

A adalah intercept atau konstanta

B adalah koefisien regresi atau slope

e adalah residual atau error

Secara praktis analisis regresi linier sederhana memiliki kegunaan sebagai berikut:

1. Model regresi sederhana dapat digunakan untuk forecast atau memprediksi nilai Y. Namun sebelum melakukan forecasting, terlebih dahulu harus dibuat model atau persamaan regresi linier. Ketika model yang fit sudah terbentuk maka model tersebut memiliki kemampuan untuk memprediksi nilai Y berdasarkan variabel Y yang diketahui. Katakanlah sebuah model regresi digunakan untuk membuat persamaan antara pendapatan (X) dan konsumsi (Y). Ketika sudah diperoleh model yang fit antara pendapatan dengan konsumsi, maka kita dapat memprediksi berapa tingkat konsumsi masyarakat ketika kita sudah mengetahui pendapatan masyarakat.

2. Mengukur pengaruh variabel X terhadap variabel Y. Misalkan kita memiliki satu serial data variabel Y, melalui analisis regresi linier sederhana kita dapat membuat model variabel-variabel yang memiliki pengaruh terhadap variabel Y. Hubungan antara variabel dalam analisis regresi bersifat kausalitas atau sebab akibat. Berbeda halnya dengan analisis korelasi yang hanya melihat hubungan asosiatif tanpa mengetahui apa variabel yang menjadi sebab dan apa variabel yang menjadi akibat.

Model regresi linier sederhana yang baik harus memenuhi asumsi-asumsi berikut:

1. Eksogenitas yang lemah, kita harus memahami secara mendasar sebelum menggunakan analisis regresi bahwa analisis ini mensyaratkan bahwa variabel X bersifat fixed atau tetap, sementara variabel Y bersifat random. Maksudnya adalah satu nilai variabel X akan memprediksi variabel Y sehingga ada kemungkinan beberapa variabel Y. dengan demikian harus ada nilai error atau kesalahan pada variabel Y. Sebagai contoh ketika pendapatan (X) seseorang sebesar Rp 1 juta rupiah, maka pengeluarannya bisa saja, Rp 500 ribu, Rp 600 ribu, Rp 700 ribu dan seterusnya.

2. Linieritas, seperti sudah dijelaskan sebelumnya bahwa model analisis regresi bersifat linier. artinya kenaikan variabel X harus diikuti secara proporsional oleh kenaikan variabel Y. Jika dalam pengujian linieritas tidak terpenuhi, maka kita dapat melakukan transformasi data atau menggunakan model kuadratik, eksponensial atau model lainnya yang sesuai dengan pola hubungan non-linier.

3. Varians error yang konstan, ini menjelaskan bahwa varians error atau varians residual yang tidak berubah-ubah pada respon yang berbeda. asumsi ini lebih dikenal dengan asumsi homoskedastisitas. Mengapa varians error perlu konstan? karena jika konstan maka variabel error dapat membentuk model sendiri dan mengganggu model. Oleh karena itu, penanggulangan permasalahan heteroskedastisitas/non-homoskedastisitas dapat diatasi dengan menambahkan model varians error ke dalam model atau model ARCH/GARCH.

4. Autokorelasi untuk data time series, jika kita menggunakan analisis regresi sederhana untuk data time series atau data yang disusun berdasarkan urutan waktu, maka ada satu asumsi yang harus dipenuhi yaitu asumsi autokorelasi. Asumsi ini melihat pengaruh variabel lag waktu sebelumnya terhadap variabel Y. Jika ada gangguan autokorelasi artinya ada pengaruh variabel lag waktu sebelumnya terhadap variabel Y. sebagai contoh, model kenaikan harga BBM terhadap inflasi, jika ditemukan atukorelasi artinya terdapat pengaruh lag waktu terhadap inflasi. Artinya inflasi hari ini atau bulan ini bukan dipengaruhi oleh kenaikan BBM hari ini namun dipengaruhi oleh kenaikan BBM sebelumnya (satu hari atau satu bulan tergantung data yang dikumpulkan).

Uji Multikolinearitas Regresi Linier Berganda

Uji Multikolinearitas Regresi Linier Berganda

Multikolinearitas dalam regresi adalah fenomena statistik dimana dua atau lebih variabel prediktor atau variabel bebas dalam model regresi berganda, saling berkorelasi tinggi. Multikolinearitas dalam regresi dapat menyebabkan hasil yang aneh terutama ketika ingin mengetahui pengaruh secara parsial variabel bebas terhadap variabel terikat.

Indikasi-indikasi bahwa sebuah model regresi mungkin memiliki masalah multikolinearitas dalam regresi:

1. Terjadi perubahan yang besar pada koefisien regresi ketika sebuah variabel yang diduga memiliki multikolinieritas ditambahkan atau dikeluarkan dari model.
2. Koefisien Regresi bertanda negatif padahal seharusnya variabel Y meningkat seiring dengan meningkatnya variabel X.
3. Koefisien regresi bertanda positif padalah seharusnya variabel Y menurun seiring dengan meningkatnya variabel X.

Cara uji multikolinearitas yang paling gampang adalah dengan melihat korelasi antara variabel prediktor dalam model regresi. ketika terjadi hubungan yang tinggi antara variabel prediktor maka kemungkinan model memiliki permasalahan multikolinieritas. Uji multikolinearitass juga dapat dilihat dari nilai VIF, dimana nilai VIF yang tinggi menunjukkan adalah permasalahan multikolinieritas.

Cara Menanggulangi masalah multikolinearitas dalam regresi

1. Keluarkan variabel X yang memiliki masalah multikolinearitas dalam model regresi.
2. Gunakan model PLS untuk memprediksi variabel Y.
3. Gunakan model Analisis jalur sebagai alternatif.
4. Jumlah data ditambah.
5. Gunakan model lag.
6. Menggunakan analisis faktor terlebih dahulu sebelum menggunakan analisis regresi

Memilih Metode Analisis Data

Memilih Metode Analisis Data

Tahap identifikasi metode analisis data dari sebuah penelitian bertujuan untuk memilih metode analisis yang tepat dalam sebuah penelitian. Pemilihan metode analisis penting dilakukan karena akan sangat berkaitan dengan keabsahan sebuah kesimpulan yang diambil.

Untuk mengidentifikasi metode analisis data yang cocok alam sebuah penelitian, secara kasar peneliti dapat melakukan identifikasi berdasarkan judul yang tercantum dalam penelitian tersebut. Dalam judul sebuah penelitian, umumnya mencantumkan kata-kata penghubung variabel.  kata-kata penghubung tersebut seperti pengaruh, efek, dampak, dan perbandingan. Kata-kata di atas memiliki keterkaitan yang erat dengan metode analisis tertentu, misalnya untuk kata pengaruh maka metode analisis data yang mungkin dapat dipilih seperti analisis regresi, analisis jalur, Structural Equation modelling, dan analisis Anova. Tidak tepat jika sebuah judul penelitian menggunakan kata hubungan sedangkan metode analisis data yang dipilih adalah Analisis Regresi atau Analisis Jalur. jika sebuah judul penelitian menggunakan kata hubungan, maka metode analisis data yang mungkin dapat digunakan adalah analisis korelasi. Begitu pula dengan kata penghubung perbandingan, penelitian yang menggunakan kata perbandingan maka metode analisis data yang umum digunakan seperti Uji t, Uji Z, uji anova, Uji Mann Whitney dan metode analisis perbandingan lainnya.

Dengan demikian, secara garis besar tujuan utama dari penelitian tersebut disarikan  dari berbagai variabel penentu penelitian tersebut seperti politik, ekonomi, dan kinerja saham pada sektor pertambangan di BEI.

Langkah berikutnya adalah memahami tujuan spesifik dari masing-masing variabel penelitianya,  sebagai berikut:

Untuk mengetahui  perkembangan situasi politik pada periode tertentu.
Untuk mengetahui perkembangan indikator ekonomi pada periode tertentu.
Untuk mengetahui kinerja saham di sektor pertambangan pada periode tertentu.
Untuk mengetahui pengaruh politik terhadap kinerja saham pertambangan pada periode tertentu.
Untuk mengetahui pengaruh ekonomi terhadap kinerja saham pertambangan pada periode tertentu.
Untuk mengetahui pengaruh politik dan ekonomi terhadap kinerja saham pertambangan secara bersamaan pada periode tertentu.
Dari judul penelitian tersebut dapat diidentifikasi rumusan masalah dan tujuan penelitian di atas, sehingga kita dapat menguraikan dan mengidentifikasi metode statistik apa saja yang cocok untuk digunakan dalam analisis penelitian tersebut.

Agar identifikasi yang kita lakukan lebih andal dan akurat, maka perlu melakukan beberapa langkah taktis untuk membedah suatu judul penelitian. Dalam setiap langkah diperlukan identifikasi yang cermat terutama terhadap kata-kata kunci (keywords), jumlah variabel dan skala pengukuran yang digunakan. Langkah-langkah untuk mengidentifikasi metode statistik dari judul dan/ataurumusan masalah penelitian adalah sebagai berikut:

Tentukan kata kunci pada judul penelitian, dalam hal ini kata-kata gambaran, pengaruh, dampak, hubungan, perbandingan atau analisis dari berbagai variabel-variabel  yang diteliti oleh periset.
Perhatikan jumlah variabel independen dan jumlah variabel dependen yang dicari (search) gambaran, pengaruh, dampak, hubungan, perbandingan atau analisisnya.
Mengetahui skala pengukuran dari setiap variabel yang akan digunakan dalam penelitian ini, baik variabel independen maupun dependen dengan tepat.
Dari uraian beberapa tahapan di atas, maka dapat kita jabarkan pada langkah-langkah berikut ini:

Langkah pertama (perhatikan kata kunci):
Ada beberapa kata kunci dalam judul penelitian:

Jika dalam penelitian ditemukan kata kunci “analisis” atau “gambaran”
Jika dalam judul penelitian ditemukan kata kunci “hubungan”
Jika dalam judul penelitian ditemukan kata kunci “pengaruh”
Jika dalam judul penelitian ditemukan kata kunci “perbandingan”
Langkah kedua (perhatikan jumlah variabel):
Jumlah variabel  penelitian 1 (satu)
Jumlah variabel independen 1 (satu) dan jumlah variabel dependen 1 (satu)
Jumlah variabel independen lebih dari 1 (satu) dan jumlah variabel dependen 1 (satu)
Jumlah variabel independen 1 (satu) dan jumlah variabel dependen lebih dari 1 (satu)
Jumlah variabel independen lebih dari 1 (satu) dan jumlah variabel dependen lebih dari 1 (satu)
Langkah ketiga (perhatikan skala pengukuran)
Skala pengukuran untuk variabel independen
2. Skala pengukuran untuk variabel dependen

Manfaat Statistika dalam Analisis Hasil Penelitian

Manfaat Statistika dalam Analisis Hasil Penelitian

Ditulis oleh: Ayat Hidayat, S.Si., MBA. (Dosen Fakultas Ekonomi Yarsi)

Dalam berbagai penelitian, kita sering melihat tampilan angka-angka statistika. Pertanyaan yang muncul adalah Apa manfaat statistika dalam penelitian apakah setiap penelitian harus menggunakan statistika? Jawabannya adalah bisa iya bisa tidak. Jawaban mantap iya jika kita akan melakukan penelitian secara kuantitatif. Dalam penelitian kuantitatif, statistik merupakan metode utama yang digunakan untuk melakukan generalisasi terhadap hasil penelitian. Ketika seorang peneliti akan menarik kesimpulan umum menjadi lebih luas, maka di saat itu statistik sangat diperlukan. Sebagai contoh, peneliti hanya melakukan penelitian di beberapa provinsi, sementara dia ingin menarik kesimpulan ke seluruh indonesia, maka dalam hal ini statistik sangat diperlukan. Angka statistik sangat berguna dalam melakukan generalisasi terhadap sebuah fenomena. Sebagai contoh, efek suatu obat kadang memiliki dampak yang berbeda-beda terhadap pasien. Untuk mengambil kesimpulan atas kejadian tersebut maka ukuran statistik dapat menggambarkan dengan baik. Misalnya dari 30 pasien yang menggunakan obat tertentu, 25 diantaranya merasakan efek positif, sisanya tidak. Dengan statistik, peneliti dapat mengetahui berapa persentase efek obat tersebut.

Dalam beberapa penelitian kualitatif, manfaat statistika tidak terlalu terlihat. Kesimpulan dari penelitian lebih banyak mengandalkan kedalaman analisis dari peneliti. Angka statistik dalam suatu peristiwa kadang bukan menjadi pertimbangan utama. Suatu kajian dalam penelitian studi kasus misalnya, penelitian seperti ini kadang peneliti cukup mengkaji kasus-kasus yang ada hubungannya saja dengan topik penelitian. Terlebih pada penelitian kualitatif etnografi, seberapa jauh peneliti dapat menggali nilai atau budaya suatu masyarakat, maka penelitian tersebut dianggap sudah berhasil. Penelitian tersebut tidak berbicara seberapa banyak dan representatif, namun lebih kepada seberapa dalam kajiannya.

Kekurangan penelitian tanpa memanfaatkan angka statistika adalah penelitian tersebut tidak dapat ditarik kepada kesimpulan yang lebih luas. Hasil dari penelitian tersebut terbatas kepada objek penelitian yang dibatasi waktu dan tempat penelitian. Sebuah kesimpulan penelitian dapat berbeda antara satu daerah dengan daerah yang lain. Namun demikian, penelitian seperti ini pun tetap diperlukan.

Berbeda dengan penelitian kualitatif, pada penelitian kuantitatif manfaat ilmu statistika begitu jelas terlihat. Bahkan tanpa ilmu statistika, sebuah penelitian kuantitatif dianggap kurang valid. Mengapa demikian? karena dalam penelitian kuantitatif, peneliti mengambil sebagian sampel secara random dari jumlah populasi yang sangat banyak. Berdasarkan jumlah sampel yang lebih sedikit tersebut, kesimpulan penelitian di-generalisasi. Ilmu statistika adalah ilmu yang powerful dalam melakukan generalisasi. Inilah yang membedakan ilmu statistika dengan ilmu matematika. Jika peneliti melakukan penelitian terhadap keseluruhan populasi, maka peneliti cukup menghitung secara matematis saja. Namun, jika peneliti hanya mengambil sebagian sampel, maka perlu dilakukan estimasi atas nilai populasi. Ilmu statistik menghitung tingkat ketepatan estimasi berdasarkan distribusi probabilitas dan nilai error.

Prasyarat utama bahwa peneliti dapat mengambil manfaat dari ilmu statistik adalah sampel diambil melalui teknik probability sampling. Ketika sampel diambil melalui proses randomisasi, baik secara simple random, systematic sampling, cluster sampling maupun proportionate sampling, maka unit sampel akan memiliki probabilitas yang sama untuk terambil. Probabilitas dari unit sampling itu akan dibentuk dalam distribusi probabilitas yang mana hasilnya akan dibandingkan dengan norma standar distribusi probabilitas. Melalui nilai distribusi probabilitas inilah, sebuah parameter populasi dapat diestimasi dengan baik.

Prinsip dasarnya adalah dimana ada uncertainty dan berlaku secara random, maka kita dapat mengambil manfaat ilmu statistika dengan baik untuk memprediksi nilai/parameter dari populasinya.

Analisis Regresi Logistik Biner

Analisis Regresi Logistik Biner

ANALISIS REGRESI LOGISTIK BINER

Analisis regresi logistik biner digunakan untuk menjelaskan hubungan antara variabel respon yang berupa data dikotomik/biner dengan variabel bebas yang berupa data berskala interval dan atau kategorik

Regresi logistik biner (logistic regression) sebenarnya sama dengan analisis regresi berganda, hanya variabel terikatnya merupakan variabel dummy (0 dan 1). Sebagai contoh, pengaruh beberapa rasio keuangan terhadap keterlambatan penyampaian laporan keuangan. Maka variabel terikatnya adalah 0 jika terlambat dan 1 jika tidak terlambat (tepat). Regresi logistik tidak memerlukan asumsi normalitas, meskipun screening data outliers tetap dapat dilakukan.

Asumsi-asumsi dalam regresi logistik biner:

  • Tidak mengasumsikan hubungan linier antar variabel dependen dan independent
  • Variabel dependen harus bersifat dikotomi (2 variabel)
  • Variabel independent tidak harus memiliki keragaman yang sama antar kelompok variabel
  • Kategori dalam variabel independent harus terpisah satu sama lain atau bersifat eksklusif
  • Sampel yang diperlukan dalam jumlah relatif besar, minimum dibutuhkan hingga 50 sampel data untuk sebuah variabel prediktor (bebas).

 

Tidak seperti regresi linier biasa, regresi logistik biner tidak mengasumsikan hubungan antara variabel independen dan dependen secara linier. Regresi logistik biner merupakan regresi non linier dimana model yang ditentukan akan mengikuti pola kurva seperti gambar di bawah ini.

Picture1

Model yang digunakan pada regresi logistik biner adalah:

Log (P / 1 – p) = β0 + β1X1 + β2X2 + …. + βkXk

 

Dimana p adalah kemungkinan bahwa Y = 1, dan X1, X2, X3 adalah variabel independen, dan b adalah koefisien regresi.

Langkah-langkah dalam penggunaan Analisis Regresi Logistik biner adalah:

  1. Uji Signifikansi Model

Untuk mengetahui pengaruh variabel bebas terhadap variabel tidak bebas secara bersama-sama (overall) di dalam model, dapat menggunakan Uji Likelihood Ratio. Hipotesisnya adalah sebagai berikut:
Ho: β1 = β2 =….= βp = 0 (tidak ada pengaruh veriabel bebas secara simultan terhadap variabel tak bebas)
H1: minimal ada satu βj ≠ 0 (ada pengaruh paling sedikit satu veriabel bebas terhadap variabel tak bebas)
Untuk j = 1,2,…,p
Statistik uji yang digunakan adalah:

Picture2

Dengan :

Lo = Maksimum Likelihood dari model reduksi (Reduced Model) atau model yang terdiri dari konstanta saja

Lp =  Maksimum Likelihood dari model penuh (Full Model) atau dengan semua variabel bebas.

Statistik G2 ini mengikuti distribusi Khi-kuadrat dengan derajad bebas p sehingga hipotesis ditolak jika p-value < α, yang berarti variabel bebas X secara bersama-sama mempengaruhi variabel tak bebas Y.

Uji Parsial dan Pembentukan Model

Pada umumnya, tujuan analsis statistik adalah untuk mencari model yang cocok dan keterpautan yang kuat antara model dengan data yang ada. Pengujian keberartian parameter (koefisien β) secara parsial dapat dilakukan melalui Uji Wald dengan hipotesisnya sebagai berikut:

Ho: βj = 0 (variabel bebas ke j tidak mempunyai pengaruh secara signifikan terhadap variabel tidak bebas

H1: βj ≠ 0 (variabel bebas ke j mempunyai pengaruh secara signifikan terhadap variabel tidak bebas)

Untuk j = 1,2,….,p
Dengan statistik uji sebagai berikut:

Picture3

Hipotesis akan ditolak jika p-value < α yang berarti variabel bebas Xj secara partial mempengaruhi variabel tidak bebas Y.

  1. Odds Ratio

Odds ratio merupakan ukuran risiko atau kecenderungan untuk mengalami kejadian ‘sukses’ antara satu kategori dengan kategori lainnya, didefinisikan sebagai ratio dari odds untuk xj = 1 terhadap xj = 0. Odds ratio ini menyatakan risiko atau kecenderungan pengaruh observasi dengan xj = 1 adalah berapa kali lipat jika dibandingkan dengan observasi dengan xj = 0. Untuk variabel bebas yang berskala kontinyu maka interpretasi dari koefisien βj pada model regresi logistik adalah setiap kenaikan c unit pada variabel bebas akan menyebabkan risiko terjadinya Y = 1, adalah exp(c.βj) kali lebih besar.
Odds ratio dilambangkan dengan θ, didefinisikan sebagai perbandingan dua nilai odds xj = 1 dan xj = 0, sehingga:

Picture4

Regresi logistik biner juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit.

Regresi logistik biner akan membentuk variabel prediktor/respon (log (p/(1-p)) yang merupakan kombinasi linier dari variabel independen. Nilai variabel  prediktor ini kemudian ditransformasikan menjadi probabilitas dengan fungsi logit. Regresi logistik juga menghasilkan rasio peluang (odds ratios) terkait dengan nilai setiap prediktor. Peluang (odds) dari suatu kejadian diartikan sebagai probabilitas hasil yang muncul yang dibagi dengan probabilitas suatu kejadian tidak terjadi. Secara umum, rasio peluang (odds ratios) merupakan sekumpulan peluang yang dibagi oleh peluang lainnya. Rasio peluang bagi prediktor diartikan sebagai  jumlah relatif dimana peluang hasil meningkat (rasio peluang > 1) atau turun (rasio peluang < 1) ketika nilai variabel prediktor meningkat sebesar 1 unit

 

 

 

Uji Anova, Teori Satu Arah dan Dua Arah

Uji Anova adalah bentuk khusus dari analisis statistik yang banyak digunakan dalam penelitian eksperimen. metode analisis ini dikembangkan oleh R.A Fisher. Uji Anova juga adalah bentuk uji hipotesis statistik dimana kita mengambil kesimpulan berdasarkan data atau kelompok statistik inferentif. Hipotesis nol dari uji Anova adalah bahwa data adalah simple random dari populasi yang sama sehingga memiliki ekspektasi mean dan varians yang sama. Sebagai contoh penelitian perbedaan perlakuan terhadap sampel pasien yang sama. Hipotesis nol nya adalah semua perlakuan akan memiliki efek yang sama.

Meskipun uji t adalah statistik yang sering digunakan, hanya saja uji t  dibatasi untuk menguji hipotesis dua kelompok. Uji Anova atau Analisis varians (ANOVA) dikembangkan untuk memungkinkan peneliti untuk menguji   hipotesis perbandingan lebih dari dua kelompok. Dengan demikian, uji-t dan uji anova adalah sama-sama metode statistik untuk perbandingan. Yang membedakan keduanya adalah hanya jumlah kelompok yang dibandingkan.

Landasan konseptual ANOVA

Seperti halnya Uji T, dalam uji Anova pun Anda harus menghitung statistik uji (dalam hal ini adalah F- rasio) untuk menguji pernyataan bahwa apakah kelompok yang dibandingkan memiliki kesamaan atau tidak. Bahasa statistik hipotesis uji Anova dapat dituliskan sebagai berikut: H0 : M1 = M2 = M3 = 0 , biasanya dengan harapan bahwa Anda akan dapat menolak H0 untuk memberikan bukti bahwa hipotesis alternatif ( H1 : Tidak H0 ) . Untuk menguji H0, Anda mengambil sampel secara acak kelompok peserta/sampel/responden dan menetapkan ukuran-ukuran (variabel dependen). Kemudian melihat apakah ukuran-ukuran tersebut berbeda berarti untuk berbagai kondisi. Jika berbeda maka Anda akan dituntun untuk menolak H0. Seperti pada uji statistik yang lain, kita menolak H0 ketika mendapati statistik uji yang diukur melalui F-statistik yang melebihi F tabel dengan tingkat kepercayaan tertentu. Cara lain dapat dilakukan dengnan melihat p-value (nilai probabilitas) yang mana lebih rendah dari 5%, misalnya kita menggunakan tingkat kepercayaan 95%.

Prinsip uji Anova adalah kita membandingkan variansi tiga kelompok sampel atau lebih. Lebih dari sekedar membandingkan nilai mean (rata-rata), uji anova juga mempertimbangkan keragaman data yang dimanifestasikan dalam nilai varians.

Apa saja asumsi yang harus dipenuhi dalam uji Anova sebagai bentuk dari model linier, berikut diantaranya:

1. Independensi observasi, setiap observasi dalam analisis anova harus bersifat independen.

2. Normalitas, Residual atau error harus mengikuti distribusi normal.

3. Homogenitas varians, varians antara kelompok yang dibandingkan harus homogen.

Mengingat uji Anova ini banyak digunakan dalam penelitian eksperimen, maka uji anova dapat dibagi berdasarkan desainnya.

1. Anova satu arah, digunakan untuk menguji perbedaan diantara dua atau lebih kelompok dimana hanya terdapat satu faktor yang dipertimbangkan. sebagai contoh membandingkan efek dosis obat yang berbeda terhadap kesembuhan pasien.

2. Anova faktorial, merupakan pengembangan dari anova satu arah dimana ada lebih dari satu faktor dan interaksinya yang dipertimbangkan. Misalnya bukan hanya faktor dosis obat tetapi juga frekuensi pemberian obat. pada anova faktorial, interaksi atau kombinasi diantara faktor juga dipertimbangkan. Pada contoh ini, interaksi antara dosis obat dan frekuensi pemberian obat dapat dihitung pengaruhnya terhadap kesembuhan pasien. Anova dua arah (two way anova) termasuk dalam Anova faktorial.

3. Anova reapeted measures, digunakan ketika dalam desain eksperimen mengijinkan subjek penelitian diikutsertakan pada perlakuan yang berbeda. terkait contoh di atas, misalnya pasien yang sama diberikan obat dengan dosis yang berbeda.

4. Multivariat Anova, berbeda dengan uji Anova yang hanya mengukur satu respon, Manova mengukur lebih dari satu respon dalam satu kali eksperimen. misalnya kita meneliti dampak obat pada beberapa dosis. Respon yang diteliti lebih dari satu misalnya kadar Trigleserida , LDL dan HDL pada pasien.

Uji Tingkat Kesukaran Soal dan Daya Pembeda

Artikel kali ini akan membahas mengenai uji tingkat kesukaran soal dan daya pembeda. Uji tingkat kesukaran soal penting biasanya digunakan dalam test pengetahuan responden.

(1) Tingkat Kesukaran Soal

Menentukan taraf kesukaran (TK) digunakan rumus sebagai berikut:

Dimana:

P       =     Indeks kesukaran

B       =     Banyaknya siswa yang menjawab soal dengan betul

JS      =     Jumlah seluruh siswa peserta tes

Dengan Interprestasi Tingkat Kesukaran sebagaimana terdapat dalam Tabel   berikut:

Tingkat Kesukaran (TK)

Interprestasi atau Penafsiran TK

TK < 0,30

Sukar

0,30 ≤ TK ≤ 0,70

Sedang

TK > 0,70

Mudah

 

(2)   Daya Pembeda (DP)

Menentukan daya pembeda (DP) digunakan rumus sebagai berikut.

Dimana:

J      =  Jumlah peserta tes

JA     =   Banyaknya peserta kelompok atas

JB     =  Banyaknya peserta kelompok bawah

BA   = Banyaknya peserta kelompok atas yang menjawab soal dengan benar

BB    =  Banyaknya peserta kelompok bawah yang menjawab soal dengan benar

=   Proporsi peserta kelompok atas yang menjawab benar

  =   Proporsi peserta kelompok bawah yang menjawab benar

Dengan interprestasi DP sebagaimana terdapat dalam Tabel berikut.

Daya Pembeda (DP)

Interprestasi atau penafsiran DP

DP ≥ 0,70

Baik sekali (digunakan)

0,40 ≤ DP < 0,70

Baik (digunakan)

0,20 ≤ DP < 0,40

Cukup

DP < 0,20

Jelek

Setelah data skor hasil uji coba diperoleh, diurutkan dari yang terbesar sampai terkecil. Kemudian dari mulai urutan teratas diambil 27% sebagai kelompok atas dan dari urutan paling bawah diambil 27% sebagai kelompok bawah. Sehingga banyak siswa kelompok atas = banyaknya siswa kelompok bawah yaitu na = nb = 5 siswa.

Perbedaan Korelasi Pearson Product Moment Dan Rank Spearman.

Korelasi Pearson Product Moment adalah korelasi yang digunakan untuk data kontinu dan data diskrit. Korelasi pearson cocok digunakan untuk statistik parametrik. Ketika data berjumlah besar dan memiliki ukuran parameter seperti mean dan standar deviasi populasi. Korelasi Pearson menghitung korelasi dengan menggunakan variansi data. Keragaman data tersebut dapat menunjukkan korelasinya. Korelasi ini menghitung data apa adanya, tidak membuat ranking atas data yang digunakan seperti pada korelasi Rank Spearman. Ketika kita memiliki data numerik seperti nilai tukar rupiah, data rasio keuangan, tingkat pertumbuhan ekonomi, data berat badan dan contoh data numerik lainnya, maka Korelasi Pearson Product Moment cocok digunakan.

Sebaliknya, Koefisien Korelasi Rank Spearman digunakan untuk data diskrit dan kontinu namun untuk statistik nonparametrik. Koefisien korelasi rank spearman lebih cocok untuk digunakan pada statistik non parametrik. Statistik nonparametrik adalah statistik yang digunanakan ketika data tidak memiliki informasi parameter, data tidak berdistribusi normal atau data diukur dalam bentuk ranking. Berbeda dengan Korelasi Pearson, korelasi ini tidak memerlukan asumsi normalitas, maka korelasi rank spearman cocok juga digunakan untuk data dengan sampel kecil. Korelasi Rank Spearman menghitung korelasi dengan menghitung ranking data terlebih dahulu. Artinya korelasi dihitung berdasarkan orde data. Ketika peneliti berhadapan dengan data kategorik seperti kategori pekerjaan, tingkat pendidikan, kelompok usia, dan contoh data ketegorik lainnya, maka Korelasi Rank Spearman cocok digunakan. Korelasi Rank Spearman pun cocok digunakan pada kondisi dimana peneliti dihadapkan pada data numerik (kurs rupiah, rasio keuangan, pertumbuhan ekonomi), namun peneliti tidak memiliki cukup banyak data (data kurang dari 30).

Kedua koefisien korelasi baik Korelasi Pearson Product Moment maupun Korelasi Spearman ini memiliki nilai antara nilai -1 sampai dengan 1. Semakin mendekati 1 maka korelasi semakin kuat sedangkan semakin mendekati nol maka korelasi antara dua variabel semakin rendah. Sedangkan tanda koefisien korelasi menunjukkan arah hubungan. tanda negatif (-) menunjukkan hubungan yang berkebalikan. Tanda (+) menunjukkan hubungan yang searah. Berkebalikan artinya semakin meningkat nilai suatu variabel maka variabel lainnya semakin menurun. Searah artinya semakin meningkat nilai suatu variabel maka variabel lainnya ikut meningkat.

Sebagai contoh, Kita ingin mengetahui hubungan antara nilai kurs rupiah dengan perubahan IHSG. Misalnya data yang dikumpulkan adalah data harian selama 100 hari. Untuk menghitung hubungan antara kedua variabel di atas Korelasi Pearson Product moment cocok digunakan. Setelah dilakukan perhitungan misalnya diperoleh nilai koefisien korelasi sebesar 0,6. Nilai tersebut menunjukkan hubungan antara kurs rupiah dengan IHSG cukup kuat dengan arah yang positif. Artinya ada kecenderungan nilai IHSG semakin menguat seiring dengan penguatan nilai kurs rupiah.

Contoh lain misalnya kita ingin mengetahui hubungan antara tingkat pendidikan dengan tingkat awareness masyarakat terhadap kebijakan pemerintah. Setelah dilakukan penghitungan dengan menggunakan Korelasi Spearman diperoleh nilai koefisien korelasi sebesar 0,3. Angka tersebut menunjukkan bahwa hubungan antara tingkat pendidikan dengan awarenss masyarakat terhadap kebijakan adalah rendah. Artinya walaupun ada keterkaitan antara semakin tingginya pendidikan seseorang dengan kepedulian mereka terhadap kebijakan pemerintah, namun hubungannya rendah.

Koefisien korelasi, baik Korelasi Pearson Product Moment maupun Korelasi Sspearman,  menunjukkan tingkat hubungan antara kedua variabel. Tingkat hubungan berbeda dengan tingkat pengaruh. Hubungan adalah keterkaitan antara dua variabel yang arahnya tidak terlalu jelas. Mana variabel yang mempengaruhi dan mana variabel yang dipengaruhi. Sedangkan pengaruh sudah jelas arahnya, mana variabel yang mempengaruhi dan mana variabel yang dipengaruhi. Misalnya peneliti ingin mengetahui apa penyebab meningkatnya berat badan seseorang. Pola konsumsi adalah salah satu penyebabnya. Untuk menganalisis pola hubungan kausalitas seperti ini, pengaruh lebih cocok digunakan dibandingkan korelasi.

Rumus Menghitung Sampel Regresi Linier

Rumus menghitung sampel regresi sama halnya dengan rumus sampel penelitian korelasi. Peneliti perlu mengetahui korelasi antara variabel pada penelitian sebelumnya. rumus korelasi ini dugunakan untuk menghitung julah sampel minimal pada penelitian yang bersifat korelasional dan bersifat kausalitas.

Berikut merupakan rumus menghitung jumlah sampel untuk penelitian korelasi / regresi linier dapat menggunakan rumus sampel Sokal dan Rohlf :

sampel1

Nilai Z menunjukkan tingkat kepercayaan yang digunakan oleh peneliti.

Dimana nilai C(r) dapat dihitung dengan formula Transformasi Fisher:

cr

Rumus menghitung sampel regresi berbeda dengan rumus sampel analisis lainnya. Dalam rumus sampel ini, peneliti harus mempertimbangkan nilai korelasi pada penelitian sebelumnya. Peneliti harus memiliki informasi mengenai nilai korelasi pada penelitian sebelumnya. Misalnya peneliti ingin mengetahui pengaruh pelatihan yang diberikan terhadap peningkatan kompetensi pegawai. Peneliti harus terlebih dahulu mengkaji penelitian-penelitian sebelumnya berapa korelasi antara pelatihan dengan kompetensi karyawan.

Sumber: Sokal, R. R. and Rohlf, F. J. Biometry, W. H. Freeman and Company, New York, 1995, p. 578

Apa itu Populasi Tertentu dan Populasi Tak Tentu?

Data populasi merupakan seluruh data  yang tersedia dan tercakup dalam suatu penelitian yang memiliki karakter tertentu. Populasi dapat dipahami sebagai keseluruhan objek psikologis yang dibatasi oleh kriteria-kriteria penelitian tertentu yang bersifat definitif. Karakter dari objek psikologis dari suatu populasi yang akan diteliti dapat bersifat konkret ataupun abstrak. Beberapa contoh objek psikologis yang bersifat konkret  adalah manusia, saham, kendaraan, kartu kredit, bank, laporan keuangan dan lain-lain. Sedangkan objek penelitian dari populasi yang berkarakter abstrak contohnya adalah sikap (behavior), persepsi, kepuasan (satisfaction), citra (image) dan lain-lain. Jumlah dari objek populasi penelitian disebut ukuran populasi (dilambangkan dengan N). Terkadang periset dalam melakukan pengujian hipotesis statistika menyebutkan ukuran populasinya. Ukuran populasi dapat diklasifikasikan menjadi 2 (dua) kelompok utama yaitu 1). Ukuran populasi tidak diketahui (infinite population) karena jumlahnya tidak diketahui dengan pasti  sehingga sulit dihitung dengan tepat dan 2). Ukuran populasi diketahui (finite population) karena jumlahnya dapat dihitung dengan kriteria yang jelas dan terukur. Secara umum populasi penelitian ditetapkan berdasarkan pertimbangan matang dari periset sendiri sesuai dengan motivasi dan tujuan penelitiannya. Kejelian periset dalam menentukan populasi penelitiannya sangat menentukan kualitas analisis dan hasil riset yang dilakukan. Untuk membedakan  populasi dengan jumlah data infinite dan finite dalam suatu penelitian ilmiah dapat disimak melalui penjelasan berikut ini : Judul penelitian 1:

“Pengaruh Iklan Sebuah Provider Telepon Seluler di Televisi terhadap Awareness pelanggan di Bandung.“

Populasi dalam penelitian ini adalah pelanggan provider telepon selular di Bandung yang pernah menonton tayangan iklan tersebut. (contoh judul di atas adalah suatu populasi penelitian dimana jumlah populasi tersebut tidak diketahui-Infinite). Judul penelitian 2:

 “Pengaruh Motivasi Kerja terhadap Produktivitas Karyawan PT. Indofood Sukses Makmur, Tbk“.

Populasi penelitiannya adalah seluruh karyawan PT. Indofood Sukses Makmur, Tbk dimana jumlahnya jelas dan terukur karena data lengkap karyawan tercatat dengan baik di perusahaan tersebut. (contoh judul di atas adalah contoh populasi dimana jumlah populasi tersebut diketahui-finite). Untuk lebih memahami perbedaan unfinite dan finite population, mari kita bersama-sama menebak pertanyaan berikut: Contoh Soal 1 pada Judul penelitian:Analisis Perilaku Pelanggan Giant Dept Store di Kawasan Jabodetabek“ Apakah jumlah populasi penelitian di atas Unfinite atau Finite? Contoh Soal 2 pada Judul penelitian:

Analisis Perkembangan Perbankan Syariah di Indonesia”

Apakah jumlah populasi penelitian di atas Unfinite atau Finite? Jawaban untuk soal nomor 1 adalah infinite population (populasi jumlah tidak terbatas). Mengapa infinite population? saya balik bertanya siapa yang mengetahui dengan pasti jumlah keseluruhan pelanggan. Saya yakin Giant Departement Store sendiri pun tidak mengetahui dengan pasti. Siapa pelanggan departement store? apakah diketahui satu-persatu dari mereka? Nampaknya tidak. Nah itulah mengapa disebut infinite population.

Untuk soal nomor 2, jawabannya adalah finite population (populasi jumlah terbatas). Mengapa finite population. Kita dapat dengan mudah mengetahui berapa jumlah bank-bank syariah yang ada di Indonesia. Kita sebagai peneliti tinggal datang ke Bank Indonesia dan menanyakan ada berapa jumlah bank-bank syariah. Populasi yang jumlahnya mudah diketahui itu disebut dangan finite population.

Setelah mengetahui apa kategorisasi populasi yang akan diteliti, finite atau infinite, maka kita dapat memilih formula untuk menghitung jumlah sampel yang sesuai. Ketika mengetahui jumlah populasi dengan pasti (finite) maka kita perlu menambahkan rumus faktor koreksi atas jumlah populasi kepada formula penghitungan sampel yang digunakan. Hal ini diperlukan untuk mendekati jumlah sampel ideal berdasarkan jumlah populasi tertentu.

Apa yang dimaksud dengan Analisis Perbandingan dalam Statistik

Analisis perbandingan digunakan untuk menguji perbandingan antara dua sampel data atau lebih (k-samples). Pada jenis penelitian komparasi ini, peneliti membandingkan dua objek atau dua perlakuan pada periode yang sama atau tidak. Pada penelitian jenis ini dapat dibagi menjadi dua jenis komparasi (perbandingan) berpasangan dan komparasi tidak berpasangan yaitu:

1. Komparasi Berpasangan

Pada penelitian komparasi berpasangan, sampel yang digunakan biasanya adalah objek yang sama, yang berbeda adalah perlakuannya. Sebagai contoh: pada judul penelitian: Analisis perbandingan metode mengajar terhadap prestasi mahasiswa SBM-ITB. Yang menjadi subjek penelitian di sini adalah mahasiswa yang sama di SBM ITB. Sedangkan objek (perlakuan) yang dibandingkan adalah prestasi mahasiswa hasil mengajar dengan metode A dan metode B. Contoh lainnya adalah:

“Analisis komparasi strategi pemasaran A dan B terhadap kinerja penjualan produk elektronik Samsung di Indonesia“

2. Komparasi Tidak Berpasangan

Pada penelitian komparasi tidak berpasangan subjek penelitian yang dibandingkan diambil dari sampel yang berbeda. Sebagai contoh pada judul penelitian:

Analisis perbandingan respon karyawan wanita dan pria terhadap kebijakan perusahaan”

Yang menjadi subjek penelitian ini ada dua kelompok yang berbeda yaitu kelompok karyawan wanita dan pria. Sedangkan yang menjadi objek penelitian (perlakuan) hanya satu yaitu respon atau sikap terhadap kebijakan baru manajemen perusahaan. Contoh lainnya adalah:

Analisis perbandingan Imbal Hasil Indeks Harga Saham Gabungan (IHSG) dengan LQ-45 periode 2005-2011”

Perhatikan Judul Penelitian, Kita Tahu Metode Analisis Datanya

Pada umumnya, judul sebuah penelitian identik dengan metode analisis data yang digunakan.  Mengapa? Karena pada judul penelitian terutama penelitian kuantitatif dicantumkan tujuan secara umum dari sebuah penelitaian. Sedangkan tujuan dari penelitian akan identik dengan beberapa kelompok metode analisis data. berikut merupakan contoh beberapa judul penelitian:

1. Hubungan antara tinggi badan anak dengan tinggi badan orang tua.

2. Pengaruh kebijakan Bank Sentral terhadap penurunan suku bunga bank komersial.

3. Perbandingan rata-rata biaya hidup di kota A dan kota B.

Jika kita perhatikan ketiga contoh judul penelitian di atas, maka terdapat kata-kata yang merujuk kepada tujuan dari penelitian tersebut. Secara garis besar, tujuan dari penelitian kuantitatif terbagi menjadi empat kelompok yaitu penelitian deskriptif, penelitian asosiatif, penelitian kausalitas/pengaruh dan penelitian perbandingan/komparatif. Masing-masing judul penelitian contoh judul penelitian di atas merujuk kepada tujuan penelitian yang berbeda. contoh pertama merujuk kepada jenis penelitian yang bertujuan untuk mencari hubungan asosiatif, contoh kedua merujuk kepada judul penelitian kausalitas dan contoh ketiga merujuk kepada penelitian yang bertujuan untuk membandingkan (komparatif).

Statistika terbukti sangat bermanfaat untuk mendeskripsi data penelitian yang diperoleh serta kemampuannya mereduksi data menjadi beberapa besaran tertentu seperti rerata (mean), median, modus, variansi (variance), simpangan baku (standard deviation), normalitas dan lainnya. Lebih jauh, statistika dimanfaatkan sebagai metode yang andal untuk melakukan inferensi melalui pengujian hipotesis (dugaan sementara), sehingga para periset dapat mengambil kesimpulan dari penelitiannya.

Melalui pengujian statistika tersebut, diharapkan proses pengambilan kesimpulan (conclusion) dan keputusan (decision) dari penelitian dapat berlangsung dengan baik dan benar dari sudut pandang ilmiah dan dapat menggeneralisasi populasi berdasarkan sampel. Sekalipun tidak tertutup kemungkinan adanya kesalahan dari hasil analisis keputusannya, namun sekurang-kurangnya statistika dapat membuat probabilitas terjadinya kesalahan tersebut seminimal mungkin. Bahkan, lebih jauh lagi tingkat kekeliruan analisis dapat dirancang sejak awal.

Metode statistik yang digunakan dalam sebuah analisis data penelitian, pada umumnya berkaitan erat dengan perumusan masalah dan kerangka pemikiran penelitian (research paradigm) itu sendiri. Perumusan masalah merupakan landasan utama dari setiap penelitian ilmiah yang menjadi panduan langkah-langkah berikutnya. Secara umum, proposal penelitian terdiri dari latar belakang, permasalahan, tujuan, kajian literatur, kerangka pemikiran, perumusan hipotesis, metode penelitian, dan rancangan analisis. Selanjutnya, setelah data penelitian dianalisis maka disusunlah pembahasan/diskusi hingga kesimpulan penelitian serta saran/rekomendasi apabila diperlukan. Untuk penelitian tingkat strategik pada umumnya dilengkapi dengan policy paper untuk memudahkan para pengambil kebijakan membuat keputusan strategiknya.

Perumusan masalah penelitian pada umumnya wajib dicantumkan dengan tegas pada Bab Pendahuluan bersama dengan tujuan bahkan judul penelitian di setiap skripsi dan tesis ekonomi. Kualitas perumusan masalah penelitian, pada umumnya sangat tergantung pada kemampuan kita dalam mengidentifikasi permasalahan dan telaahan (review) teori dan penelitian sebelumnya.  Semakin tajam dan komprehensif dalam mengidentifikasi masalah penelitiannya yang disertai kedalaman telaahan terhadap artikel ilmiah terkait dan terbaru (recent research), maka akan semakin baik pula kualitas penelitiannya. Oleh karena itu, kesalahan dalam mengidentifikasi masalah penelitian (sympton) akan berakibat fatal.  Identifikasi masalah merupakan bagian terpenting dari belakang penelitian yang menjadi landasan utama dalam membentuk kerangka pemikiran, metode penelitian, rancangan analisis dan alur penelitian yang akurat.

Selain itu, jumlah dan kualitas referensi terbarukan yang dijadikan acuan penelitian akan menentukan kualitas state of the art suatu penelitian yang memenuhi unsur-unsur kemutakhiran (novelty) dan originalitas penelitiannya. Sebagaimana kita ketahui bersama, kualitas kerangka pemikiran merupakan landasan utama penyusunan hipotesis yang akan diuji, metode penelitian dan rancangan analisis yang sesuai dan konsisten dengan tujuan utama penelitian. Perlu diingatkan kembali, bahwa pada proses penentuan hipotesis  harus dilandasi teori yang kokoh (robust) dan didukung oleh berbagai temuan penelitian sebelumnya sesuai dengan topik penelitiannya.

Setiap rumusan masalah penelitian yang dibentuk melalui dasar teori dan beberapa penelitian sebelumnya tersebut akan diuji melalui  hipotesis dalam bentuk dugaan sementara sebagai jawaban masalah penelitian inferensial. Dalam hal ini, pengujian statistik  terhadap berbagai hipotesis, hanyalah salah satu metode (tool) yang digunakan untuk membuktikan hipotesis penelitian tersebut. Melalui pengujian statistik tersebut, kita dapat menyimpulkan apakah hipotesis penelitian yang kita ajukan sebelumnya ditolak (rejected) atau tidak ditolak (not rejected).

Analisis Item

Dalam penyusunan sebuah alat ukur, tahapan yang harus dilakukan adalah analisis item (Guilford & Fruchter, 1985). Istilah analisis item digunakan untuk mendefinisikan perhitungan dan pengujian statistikal terhadap skor-skor item alat ukurindividual (Crocker & Algina, 1986). Sebuah item dapat dianalisa, baik itu analisa kualitatif (berdasarkan isi maupun bentuk dari item tersebut) dan analisa kuantitatif (berdasarkan muatan-muatan statistik seperti daya prediktif, daya beda dari item tersebut). Analisa kualitatif mencakup pertimbangan isi validitas, sedangkan analisa kuantitatif mencakup pengukuran kesulitan butir soal dan diskriminasi item (Anastasi & Urbina, 1997). Tujuan utama dalam melakukan analisa item adalah untuk meningkatkan reliabilitas dan validitas suatu alat ukur(Guilford & Frutcher, 1985).

Menurut Crocker & Algina (1986) pengukuran yang umum digunakan dalam analisa item, adalah: Item difficulty, Item discrimination, dan Item-total correlation.

a. Item Difficulty

Jika skoring pada sebuah item itu dikotomi, maka rata-rata skor item berhubungan dengan banyaknya subyek yang menjawab item tersebut dengan benar. Proporsi orang yang menjawab benar untuk item inilah yang disebut dengan item difficulty, atau yang biasa diberi simbol p (Anastasi & Urbina, 1997).

b. Item Discrimination

Tujuan dari kebanyakan pengukuran psikologis adalah memberikan informasi mengenai perbedaan individu (individual differences) dalam hal konstruk yang diukur tes atau dari kriteria eksternal yang ingin diprediksi oleh alat tes tersebut

(Crocker&Algina, 1986). Oleh karena itu sebuah tes perlu memiliki daya diskriminasi. Pengertian dari daya diskriminasi adalah derajat dimana item dapat membedakan responden dengan skor tinggi dan skor rendah (Cohen&Swerdlik,2005).

Terdapat beberapa metode untuk melihat daya diskriminasi sebuah item. Salah satu metodenya melakukan perbandingan dengan cara membedakan kelompok responden dengan menentukan titik potong pada distribusi skor (Crocker&Algina, 1986; Kaplan&Saccuzzo, 2005). Sedangkan metode lainnya merupakan metode koefisien korelasi. Berikut adalah penjelasan mengenai setiap metode.

c.  Item Total Corellation

Metode item-total correlation merupakan suatu teknik analisis item yang mengkorelasikan skor item dengan skor total keseluruhan(Crocker & Algina, 1986; Guilford, 1954; Kaplan & Saccuzzo, 2005; Nunnally & Bernstein, 1994). Dengan kata lain, daya diskriminasi item melihat apakah subyek yang mampu menjawab sebuah item dengan benar juga bisa menjawab dengan benar pada item- item lainnya (Kaplan, 2005). Beberapa jenis korelasi yang digunakan dalam pengujian ini adalah Pearson’s Product Moment Correlation, Point Biserial Correlation, Biserial Correlation, Phi Coefficient, atau Tetrachoric Correlation Coefficient (Crocker & Algina, 1986). Grimm (1993) menjelaskan bahwa jika skor item dan skor total berupa variabel kontinu maka metode korelasi yang digunakan adalah Pearson’s Product Moment Correlation. Kemudian jika variabel skor total adalah kontinu dan skor item dikotomi, maka metode korelasi yang digunakan adalah Point Biserial atau Biserial Correlation.

Korelasi Rank Spearman dengan SPSS

Banyak yang masih bingung apa yang disebut dengan korelasi rank spearman atau pearson dan apa bedanya dengan regresi. baik korelasi maupun regresi sama-sama populer untuk pengguna software SPSS. Dalam statistik, ketergantungan (dependence) merujuk kepada hubungan antara dua variabel random atau dua set data. Analisis korelasi merujuk kepada kelompok hubungan yang luas yang melibatkan ketergantungan (dependence). Contoh yang paling umum untuk analisis korelasi ini adalah hubungan antara tinggi badan orang tua dengan tinggi badan keturunannya, atau contoh lainnya adalah hubungan antara permintaan produk dan harga. Sementara pada analisis regresi, variabel yang kita teliti harus bersifat kausalitas atau sebab akibat. Sebagai contoh pengaruh motivasi terhadap kinerja karyawan.

Dalam konteks korelasi sendiri, Ada analisis Korelasi Rank Spearman dan Korealsi Pearson. Perbedaan keduanya terletak pada skala variabel yang digunakan. Sebagai contoh korelasi antara penggunaan listrik dengan rata-rata cuaca pada masing-masing wilayah. Hasil penghitungan korelasi dengan SPSS menunjukkan bahwa terdapat korelasi antara penggunaan daya listrik yang bertambah pada daerah-daerah dengan rata-rata cuaca harian yang ekstrim. Daerah-daerah dengan cuaca yang ekstrim akan menggunakan daya listrik yang lebih banyak dibandingkan daerah dengan cuaca menengah. Hal tersebut terjadi karena penduduk wilayah tersebut perlu menghangatkan atau mendinginkan suhu udara melalui AC atau pemanas pada daerah dingin. Daya listrik digunakan untuk menghidupkan alat pengkondisi udara. Untuk mengukur hubungan antara kedua variabel di atas, Korelasi Rank Spearman cocok digunakan. Mengapa? Karena kedua skala ukur kedua variabel di atas bersifat numerik. Daya listrik diukur dengan Watt yang mana adalah numerik, begitu pun suhu udara yang dapat diukur dengan derajat celcius (C).

Tabel 1 Rata-rata penggunaan daya dan suhu harian

 Daerah/WilayahRata-rata penggunaan daya listrik per rumah tangga perbulanRata-rata suhu harian
Daerah 1 835 21
Daerah 2 434 25
Daerah 3 654 24
Daerah 4 986 28
Daerah 5 1232 29
Daerah 6 434 23
Daerah 7 543 24
Daerah 8 523 22.5
Daerah 9 654 27
Daerah 10 456 24

sumber: data ilustrasi

Setelah data di atas terkumpul, maka dihitung koefisien korelasinya denan menggunakan software SPSS. Prosedurnya sederhanya. Kita tinggal melakukan input data di atas ke dalam SPSS kemudian ikuti perintah menu sebagai berikut:

Analyze –> Correlate –> bivariate

 

Masukan kedua variabel ke dalam kolom sebelahnya, setelah itu pilih metode Rank Spearman atau Pearson (Product moment) yang akan digunakan. Selanjutnya klik OK.

 

Perbedaan mendasar kedua metode korelasi ini terletak pada skala ukur data dan jumlah data. Metode Korelasi Rank Spearman diperuntukkan untuk data yang bersifat kategorik sedangkan korelasi Pearson cocok untuk variabel dengan skala ukur numerik dan jumlah banyak (lebih dari 30). Secara singkat Korelasi rank Spearman diperuntukkan untuk parametrik dan korelasi pearson diperuntukkan untuk statistik non parametrik.

Pada contoh kasus di atas, variabel daya listrik dan suhu udara memiliki skala numerik, namun jumlah data kurang dari 30 data. Lalu, metode korelasi mana yang cocok digunakan? Korelasi rank spearman cocok digunakan dibandingkan korelasi pearson karena variabel yang diukur bersifat nonparametrik.

Baik pada analisis korelasi Rank spearman maupun korelasi Pearson, koefisien korelasi atau besarnya hubungan antara variabel disimbolkan dengan r atau rho. Koefisien korelasi ini besarnya berkisar antara -1 sampai dengan +1. Koefisien korelasi yang semakin mendekati nol semakin menunjukkan semakin rendahnya hubungan antara kedua variabel. Sedangkan semakin mendekati 1 semakin kuatnya hubungan tersebut. Tanda – (negatif) menunjukkan hubungan yang berkebalikan. Melalui Software SPSS, kita dapat dengan mudah menghitung koefisien korelasi  dalam hitungan detik.

Teknik Analisis Data

Teknik analisis data adalah sebuah proses pemilihan data, pembersihan data, mentransformasi data, sehingga diperoleh informasi yang bermanfaat dari data. Teknik analisis data terdiri dari beberapa jenis tergantung kepada tujuan dari analisa data itu sendiri dan karakteristik data yang akan diolah.

Sebelum memilih teknik analisis data tertentu, peneliti perlu mengetahui apa tujuan dari analisis data tersebut, apakah hanya bersifat menggambarkan, apakah perlu membandingkan, apakah menghubungkan antara variabel atau bahkan mencari hubungan sebab akibat dari beberapa variabel. Kecermatan dalam melihat tujuan penelitian sangat mempengaruhi pemilihan teknik analisis data.

Hal lain yang perlu diperhatikan peneliti sebelum memilih suatu teknik analisis data, mereka perlu mamahami karakteristik dari data tersebut apakah data berskala nominal, ordinal, interval ataukah rasio. Karakteristik data juga dapat dilihat dari pola data tersebut apakah mengikuti pola distribusi normal atau tidak. Karakteristik data yang berbeda akan mempengaruhi pemilihan teknik analisis data yang berbeda pula.

Tujuan penelitian dikelompokan menjadi apakah bertujuan hanya untuk menggambarkan, membandingkan atau mencari pola hubungan antara variabel. Jika hanya menggambarkan, maka penelitian masuk ke dalam analiais deskriptif. Jika bertujuan untuk membandingkan maka penelitian masuk ke dalam kelompok penelitian komparasi. Berbeda dengan penelitian yang bertujuan mencari pola hubungan antara variabel, penelitian seperti ini masuk ke dalam penelitian korelasional atau kausalitas. penelitian komparasi, penelitian korelasional dan penelitian kausalitas bersifat konfirmatori atau mengiji hipotesis.