Fakultas Psikologi Universitas Merdeka Malang
Nim: 16090000075

Subjek Artikel Ilmiah PSP
Perbedaan Skala Likert dan Skala Thurstone

Astri Ardiyanti Said
Fakultas Psikologi Universitas Merdeka Malang

Pengantar
Pengukuran (measurement) merupakan suatu cara yang sistematis untuk menetapkan secara pasti bilangan-bilangan (angka-angka) atau nama-nama terhadap suatu obyek dan atribut-atributnya (Baltes, Reese & Nesesel roade, 1988; Elmes, Kantowitz, & Roedriger III, 1992; Nunnally, 1978). Pengukuran merupakan aspek penting dalam penelitian psikologis maupun penelitian-penelitian dalam bidang lainnya. Seperti dikemukakan oleh Boring, seorang tokoh psikologi yang terkenal (Elmes, Kantowitz, & Roedriger III), “a science grows and progresses to the extent that it uses measurement testable hypotheses imply that the predicted outcomes can be measured empirical observations in psychology are based on the measurement of dependent variables. Measurement then is an importantaspect of scientific psychology (1992:75).   
Baltes, Reese, & Nesselroade (1988) juga menyatakan bahwa pengukuran merupakan salah satu landasan (cornerstone) dalam penelitian empiris dari berbagai disiplin ilmiah. Pengukuran secara langsung merepresentasikan suatu cara yang dipilih oleh peneliti untuk mendefinisikan konsep-konsep penting.
Penyusunan skala psikologi merupakan salah satu cara dalam membuat alat tes yang nanti akan mengukur suatu sikap atau atribut psikologi yang ingin diukur. Dalam pengukuran ini ada berbagai metode yang di pakai yaitu metode skala likert, thurstone dan diskriminasi skala. Ketigaa metode ini mempunyai karakteristik yang berbeda namun diskriminasi skala merupakan kombinasi dari skala likert dan skala thurstone. Penggunaan indikator guna mendefinisikan suatu konstruk psikologis merupakan salah aspek pengukuran dalam penelitian. Pengukuran itu sendiri merupakan aspek penting dalam penelitian. Indikator merupakan jabaran operasional dari suatu konstruk psikologis yang hendak diukur dan diteliti. Indikator juga merupakan acuan darimana butir-butir alat ukur dikembangkan atau disusun.  Setelah memilih suatu konstruk yang hendak diteliti dan kemudian menjabarkannya ke dalam indikator-indikator dan butir-butir pengukuran, langkah selanjutnya yang harus dilakukan oleh peneliti adalah memilih atau menetapkan alat ukur atau instrumen penelitian.

Skala thurstone
Metode interval tampak-setara, yang sering pula dikenal sebagai metode penskalaan Thurstone, merupakan salah satu model penskalaan pernyataan sikap dengan pendekatan stimulus. Artinya penskalaan penskalaan dalam pendekatan ini ditujukan untuk meletakkan stimulus atau pernyataan sikap pada suatu kontinum psikologis yang akan menunjukkan derajat favorable dan tak favorablenya pernyataan yang bersangkutan. Dengan metode ini, setelah pernyataan dibuat dengan sesuai kaidah penulisan aitem maka kita perlu menetapkan sekelompok orang yang akan bertindak sebagai tim penilai (judging group).
Tugas dari tim penilai ini meletakkan derajat favorable atau tak favorable pada garis kontinum yang terdiri dari 1 sampai 11 interval yang artinya angka 1 sampai 5 merupakan interval dari tak favorable dan 7 sampai 11 merupakan interval dari favorable dan 6 merupakan interval netral. Jadi semakin ke kanan menunjukan semakin favorable aitem tersebut dan semakain ke kiri menunjukan semakin tak favorable begitu pun pada interval 6 menunjukan aitem tersebut netral. Disini tim penilai akan meletakkan tiap aitem ke interval derajat favorable dan tak favorable.



Skala likert
            Metode rating yang dijumlahkan popular dengan nama penskalaan model likert (Gable, 1986)- merupakan metode penskalaan pernyataan sikap yang menggunakan distribusi respons sebagai dasar penentuan nilai skalanya. Dalam pendekatan ini tidak diperlukan adanya kelompok panel penilai (judging group) dikarenakan nilai skala setiap pernyataan tidak akan di tentukan oleh derajat favorablenya masing-masing akan tetapi ditentukan oleh distribusi respons setuju atau tidak tidak setuju dari sekelompok responden yang bertindak sebagai kelompok uji-coba (pilot study).
            Kelompok uji coba ini hendaknya memiliki karakteristik yang semirip mungkin dengan karakteristik individu yang hendak diungkap sikapnya oleh skala yang sedang disusun. Disamping itu agar hasil analisis dalam penskalaannya lebih cermat dan stabil responden yang digunakan sebagai kelompok uji-coba harus berjumlah banyak sehingga distribusi skor mereka lebih bervariasi. Bnyaknya responden dalam  uji-coba ini, menurut saran Gable (1986), adalah sekitar 6 sampai 10 kali lipat banyaknya pernyataan yang akan dianalisis.
Prosedur penskalaan dengan metode rating yang dijumlahkan didasari oleh dua asumsi, yaitu:
1.      Setiap pernyataan sikap yang telah di tulis dapat disepakati sebagai termasuk pernyataan yang favorable atau pernyataan yang tak favorable.
2.      Jawaban yang diberikan oleh individu yang mempunyai sikap positif harus diberi bobot atau nilai yang lebih tinggi daripada jawaban yang diberikan oleh responden yang mempunyai sikap negatif.
Untuk melakukan penskalaan ini semua pernyataan yang di sudah disusun berdasarkan penulisan aitem yang tepat. Responden diminta untuk menyatakan kesetujuan atau ketidaksetujuan terhadap isi pernyataan dalam lima macam kategori yaitu:
·         Sangat Tidak Setuju (STS)
·         Tidak Setuju (ST)
·         Entahlah (E)
·         Sangat Setuju (SS)
·         Setuju (S)
Dalam peosedur ini kita tidak lagi bermaksud meletakkan stimulus (pernyataan) paa suatu kontinum psikologis akan tetapi kita akan menentukan letak masing-masing  kelima kategori respons pada kontinumnya yang, misalnya, bergerak antara angka 0 sampai dengan angka 4. Dalam kedua asumsi dasar yang disebutkan diatas tidak dikatakan adanya anggapan bahwa jarak antara masing-masing kategori respons harus sama besar (equal intervals). Akan tetapi kita akan menentukan jarak antara kategori respons dalam unit berskala interval.
            0              1            2             3             4
            --.----------.----------.----------.----------.—
              STS               TS        E                      SS

Perbedaan
Perbedaan antara kedua skala tersebut dilihat dari:
1.      Thurstone menggunakan judging group yaitu dimana judging group bertugas dalam memberikan derajat favorable dan tak favorable pada aitem yang tersedia. Sedangkan pada skala likert tidak memakai judging group melainkan mengguanak expert judgment atau pilot study yang bertindak memberikan setuju atau tidak setuju pada aitem yang sudah disusun.
2.      Pada penyebaran aitem pun keterangan pada blue print berbeda seperti pada tursthone menggunakan interval setuju dan tidak setuju tetapi pada skala likert menggunakan 5 kategori yaitu setuju, sangat setuju, entahlah, tidak setuju, sangat tidak setuju.
3.      Kemudian dalam penskoran aitem pun berbeda pada thurstone skoring aitem yang hanya di hitung jawaban “ya” pada aitem yang tersedia namun pada skala likert yang memberikan jawaban yang mendukung terhdap skala sikap yang disusun makan akan diberikan skor 4.
4.      Dalam memilih pernyataan terbaik pada thurstone dihitung nilai S dan nilai Q. Nilai Q merupakan ukuran variasi distribusi penilaian dari 50% kelompok penilai terhadap suatu pernyataan. Semakin besar nilai Q berarti penilaian para anggota kelompok penilai semakin bervariasi yang artinya pendapat mereka mengenai darajat favorable atau tak favorablenya pernyataan itu semakin bermacam-macam dan tidak sesuai satu sama lain. Sedangkan pada skala likert mencari daya beda tinggi untuk memisahan antara mereka yang termasuk dalam kelompok responden yang memiliki sikap negatif dan positif.
5.      Blue print penyebaran aitem:
·         Skala Thurstone
No
Pernyataan
Setuju
Tidak Setuju
1
Saya merasa iri saat anak saya lebih banyak menghabiskan waktu dengan pasangannya


2
Saya merasa kurang diperhatikan oleh anak saya


3
Saya merasa iri saat anak saya lebih banyak menghabiskan waktu dengan pasangannya


4
Saya senang peran saya sebagai orang tua telah terpenuhi



·         Skala Likert
No
Pernyataan
S
SS
E
TS
STS
1
Saya merasa iri saat anak saya lebih banyak menghabiskan waktu dengan pasangannya





2
Saya merasa kurang diperhatikan oleh anak saya





3
Saya merasa iri saat anak saya lebih banyak menghabiskan waktu dengan pasangannya





4
Saya senang peran saya sebagai orang tua telah terpenuhi













Penutup
Dari penjelasan diatas maka dapat disimpulkan bahwa skala thurstone memakai pendekatan stimulus dengan adanya tim penilai (judging group) yang akan meletakkan derajat favorable pada setiap aitem sedangkan skala likert memakai pendekatan respon yaitu dengan tidak melihat derajat favorablenya masing-masing aitem akan tetapi ditentukan oleh distribusi respons setuju atau tidak tidak setuju dari sekelompok responden yang bertindak sebagai kelompok uji-coba (pilot study).


Daftar Pustaka

 

Budiaji, W. (213). SKALA PENGUKURAN DAN JUMLAH RESPON SKALA LIKERT. Psikologi, 127.
Dr. SAifuddin Azwar, M. (1995). Sikap Manusia. Yogyakarta: Pustaka Belajar.
Dr. SAifuddin Azwar, M. (2012). Penyusunan Skala Psikologi. Yogyakarta: Pustaka Belajar.
Marliani, R. (2010). PENGUKURAN DALAM PENELITIAN PSIKOLOGI . Psikologi, 108-109.
Murti, S. A. (2014). Penskalaan Thurstone pada Aitem Thyroid Dysfunction Questionnaire (TDQ) Berbasis Gejala Biopsikososial. Psikologi, 135-136.
Mutalazimah. (2010). Status klinis sebagai prediktor status yodium urin pada kasus thyroid dysfunction anak sekolah, Jurnal Nutrisia, 12(2), 79-85.
Likert RA. 1932. Technique for the measurement of attitudes. Archives of Psychology, 140 pp: 1-55
Setiawati, F. A. (2014). PERBANDINGAN BERBAGAI METODE PENSKALAAN YANG DIKEMBANGKAN THURSTONE. Psikologi, 86-88.
Sugiyanto. (2009). MANIPULASI: KARAKTERISTIK EKSPERIMEN. Jurnal Psikologi, 98-108.
Urbina, A. A. (2006). Tes Psikologi. Jakarta: Indeks.





Komentar

Postingan populer dari blog ini