4 Jenis Reliabilitas
Home ilmu

4 Jenis Reliabilitas

Reliabilitas alat ukur adalah ketetapan atau keajegan alat tersebut dalam mengukur apa yang diukurnya. Artinya, kapan pun alat ukur tersebut digunakan akan memberikan hasil ukur yang sama. Contoh paling nyata adalah timbangan atau meteran. Hal yang sama terjadi untuk alat ukur suatu gejala, tingkah laku, ciri atau sifat individu dan lain‑lain. Misalnya alat ukur prestasi belajar seperti tes hasil belajar, alat ukur sikap, kuesioner dan lain‑lain, hendaknya meneliti sifat ke­ajegan tersebut.

Tes hasil belajar dikatakan ajeg apabila hasil pengukuran saat ini menunjukkan kesamaan hasil pada saat yang berlainan waktunya, terhadap siswa yang sama. Misalnya siswa kelas V pada hari ini di tes kemampuan matematik. Minggu berikutnya siswa tersebut di tes kembali. Hasil dari kedua tes relatif sama. Sungguhpun demikian masih mungkin terjadi ada perbedaan hasil untuk hal‑hal tertentu akibat faktor kebetulan, selang waktu, terjadinya perubahan panda­ngan siswa terhadap soal yang sama. Jika ini terjadi, kelemahan ter­letak dalam alat ukur itu, yang tidak memiliki kepastian jawaban atau meragukan siswa. Dengan kata lain derajat reliabilitasnya masih rendah.

Di lain pihak perbedaan hasil pengukuran bukan disebabkan oleh alat ukurnya, melainkan kondisi yang terjadi pada diri siswa. Misal­nya fisik siswa dalam keadaan sakit pada waktu tes yang pertama, motivasi pada waktu tes pertama berbeda dengan motivasi tes pada berikutnya.

Atas dasar itu perbedaan hasil pengukuran pertama dengan hasil pengukuran berikutnya bisa teijadi akibat perubahan pada diri subjek yang diukur dan atau oleh faktor yang berkaitan dengan pemberian tes itu sendiri. Hal ini tidak mengherankan dan sudah umum terjadi, yang sering dinyatakan dengan sebutan/istilah kesalahan peng­ukuran. Ini berarti, skor hasil pengukuran yang pertama dan skor hasil pengukuran kedua terhadap subjek sama, dimungkinkan ter­jadinya kesalahan pengukuran disebabkan oleh dua faktor di atas. Oleh karenanya setiap skor hasil pengukuran menghasilkan dua bagian, yakni hasil pengukuran pertama yang disebut skor sejati dan hasil pengukuran berikutnya terhadap subjek yang sama, yang me­ngandung hasil skor plus kesalahan pengukuran.Komponen skor sejati dan skor yang mengandung kesalahan pengukuran dinyatakan dalam suatu persamaan matematis sebagai berikut:

X  =b + s,

dengan:

X = skor yang diamati
b = skor sejati
s = kesalahan pengukuran

Dalam suatu penelitian skor yang diamati adalah skor sejati ditambah skor kesalahan pengukuran sehingga variansi skor yang diamati X2 adalah variansi skor sejati Tb2 ditambah variansi skor kesalahan Ts2 atau Tx2 = Tb2 + Ts2.
Indeks reliabilitas alat ukur dalam suatu penelitian dapat dicari dengan mengkorelasikan skor‑skor yang diperoleh dari hasil peng­ukuran yang berulang‑ulang pada waktu yang berbeda, atau dengan kelompok pertanyaan yang sepadan. Prosedur ini dilakukan dengan cara memberikan tes dua kali kepada subjek yang sama pada waktu yang berbeda. Cara kedua adalah membagi alat ukur (tes) menjadi dua bagian yang sama atau yang setarap untuk melihat keajegan tes tersebut. Cara yang pertama dikenal dengan tes ulang (test retest) dan cara kedua dikenal dengan pecahan sebanding/setara.

a. Reliabilitas tes ulang

Tes ulang (test‑retest) adalah penggunaan alat ukur terhadap subjek yang diukur, dilakukan dua kali dalam waktu yang berlainan. Misal­nya tes hasil belajar matematika untuk siswa SD kelas V, diberikan hari ini, lalu diperiksa hasilnya. Seminggu kemudian tes tersebut diberikan lagi pada siswa yang sama dan hasilnya diperiksa. Hasil pengukuran yang pertama kemudian dikorelasikan dengan hasil pe­ngukuran yang kedua untuk mendapatkan koefisien korelasinya (r). Koefisien korelasi ini disebut koefisien reliabilitas tes ulang, yang hasilnya akan bergerak dari ‑ 1,0 sampai + 1,0. Bila koefisien reliabilitas mendekati angka 1,0 merupakan indeks reliabilitas tinggi. Artinya hasil pengukuran yang pertama relatif sama dengan hasil pengukuran yang kedua. Dengan kata lain alat ukur tersebut memiliki tingkat keajegan atau ketetapan (reliabel). Untuk pengukuran ilmu‑ilmu sosial dan pendidikan indeks reliabilitas 0,75 sudah dianggap cukup mengingat sifat dan ilmu sosial dan pendidikan ber­beda dengan ilmu‑ilmu eksakta.


Jarak atau selang waktu antara pengukuran pertama dengan pengukuran kedua sebaiknya tidak terlalu dekat dan juga tidak ter­lalu jauh. Jika terlalu dekat/pendek, hasil pengukuran banyak dipengaruhi oleh ingatan siswa tentang jawaban yang diberikan pada pe­ngukuran yang pertama, bukan karena keajegan alat ukurnya. Sebaliknya jika selang waktu pengukuran pertama dengan peng­ukuran kedua terlalu lama, bisa terjadi adanya perubahan penge­tahuan dan pengalaman siswa sehingga mempengaruhi koefesien re­liabilitasnya. Asumsi yang digunakan dalam tes ulang ialah karak­teristik yang diukur oleh alat ukur tersebut stabil sepanjang waktu, sehingga jika ada perubahan skor hasil kedua pengukuran lebih di­sebabkan kesalahan alat ukur. Cara tes ulang (test‑retest) banyak di­gunakan dalam menetapkan atau menentukan tingkat reliabilitas alat ukur dalam penelitian sosial dan pendidikan.

b. Reliabilitas pecahan setara

Reliabilitas bentuk pecahan setara tidak dilakukan pengulangan pengukuran kepada subjek yang sama tetapi menggunakan hasil dari bentuk tes yang sebanding atau setara yang diberikan kepada subjek yang sama pada waktu yang sama pula. Dengan demikian diperlukan dua perangkat alat ukur yang disusun sedemikian rupa agar memiliki derajat kesamaan atau kesetaraan baik dari segi, isi, tingkat kesu­karan alat ukur, abilitas yang diukur, jumlah pertanyaan, bentuk pertanyaan dan segi‑segi teknis lainnya. Yang berbeda hanyalah per­tanyaan. Bila penyusun kesetaraan alat ukur bisa dicapai seoptimal mungkin maka koefisien reliabilitas dari prosedur ini dianggap paling baik dibandingkan dengan prosedur tes ulang. Namun kesulitannya terletak dalam menyusun perangkat alat ukur yang benar‑benar me­ngandung derajat kesetaraan tinggi.

c. Reliabilitas belah dua

Reliabilitas belah dua mirip dengan reliabilitas pecahan setara ter­utama dari pelaksanaannya. Dalam prosedur ini alat ukur diberikan kepada kelompok subjek cukup satu kali atau satu saat. Butir‑butir soal dibagi dua bagian yang sebanding, biasanya membedakan soal nomor genap dengan soal nomor ganjil. Setiap bagian soal diperiksa hasilnya, kemudian skor dari kedua bagian tersebut dikorelasikan untuk dicari koefisien korelasinya. Mengingat korelasi tersebut hanya berlaku separuh tidak untuk seluruh pertanyaan, maka koefisien korelasi yang didapatkannya tidak untuk seluruh soal, tapi hanya se­paruhnya. Oleh sebab itu koefisien korelasi belah dua perlu diubah ke dalam koefisien korelasi untuk seluruh soal dengan menggunakan rumus ramalan Spearmen Brown:

Dari contoh di atas terjadi peningkatan koefisien korelasinya, setelah dilakukan pengubahan. Assumsi yang digunakan dalam prosedur be­lah dua adalah kedua bagian alat ukur itu pararel, sekalipun sering keliru atau tidak benar. Akibat adanya pengubahan koefisien relia­bilitas, prosedur belah dua cenderung menunjukkan koefisien re­liabilitas yang tinggi daripada prosedur tes ulang dan pecahan setara. Oleh sebab itu penggunaan belah dua harus lebih berhati‑hati. Prosedur ini digunakan bila alat ukur mengandung atau terdiri dari banyak item, item relatif berat/sukar (power test), materi yang diuji cukup komprehensif sehingga memungkinkan penyusunan dua soal untuk satu permasalahan yang sama untuk memenuhi belah dua.

d. Kesamaan rasional

Di samping cara‑cara yang dijelaskan di atas ada prosedur meng­hitung reliabilitas tanpa melakukan korelasi dari dua pengukuran atau pecahan setara dan belah dua. Cara tersebut adalah kesamaan rasional. Prosedur ini dilakukan dengan menghubungkan setiap butir dalam satu tes dengan butir‑butir lainnya dan dengan tes itu sendiri secara keseluruhan. Salah satu cara yang sering digunakan adalah menggunakan rumus Kuder-Rechardson atau KR 21.

Rumusnya:
rxx   = reliabilitas tes secara keseluruhan
K    = jumlah butir soal dalam tes
s2    = variasi skor
X   = mean skor

Misalnya disusun tes sebanyak 80 soal. Setelah diberikan kepada sejumlah siswa dalam kelas tertentu, lalu dicari nilai rata‑rata dan simpangan bakunya. Misalnya diperoleh nilai rata‑rata 60 dan simpangan bakunya 8. Dengan rumus di atas maka:
Uraian ukuran reliabilitas yang telah dijelaskan di atas dapat dipertimbangkan oleh peneliti, cara mana yang paling tepat digunakan ber­gantung pada peneliti. Pertimbangan tersebut, antara lain sifat va­riabel yang diukur, jenis alat ukur, jumlah subjek yang diukur, serta hasil‑hasil pengukuran yang diharapkan sesuai dengan tujuan penelitian.

Baca juga :

Subscribe Via Email Gratis

to Top