RELIABILITAS DAN MODEL KLASIK SKOR SEBENARNYA


PENDAHULUAN
Salah satu masalah utama dalam kegiatan penelitian sosial dan psikologi adalah masalah cara memperoleh data informasi yang akurat dan obyektif. Hal ini menjadi sangat penting artinya dikarenakan kesimpulan penelitian hanya akan dapat dipercaya apabila didasarkan pada informasi yang juga dapat dipercaya. Informasi yang akurat dan obyektif dalam penelitian biasanya tidak mudah diperoleh terutama dikarenakan konsep mengenai variabel yang diukur tidak selalu mudah dioperasionalkan sebagaimana dalam penelitian. Operasional atribut dan variabel yang hendak diteliti sudah dapat ditegakkan prosedur pengukurannya yang menjadi penentu apakah informasi yang dihasilkannya dapat dipercaya atau tidak.
Reliabilitas merupakan suatu hasil pengukuran yang dapat dipercaya. Hasil pengukuran dapat dipercaya hanya apabila dalam beberapa kali pelaksanaan pengukuran terhadap kelompok subjek yang sama diperoleh hasil yang relatif sama selama aspek yang diukur dalam diri subjek memang belum berubah. Dalam hal ini relatif sama berarti tetap adanya toleransi terhadap perbedaan-perbedaan kecil diantara hasil beberapa kali pengukuran. Bila perbedaan itu sangat besar dari waktu-kewaktu maka hasil pengukuran tidak dapat dipercaya dan dikatakan tidak reliabel.
Pengukuran  dan reliabilitas dalam model klasikal skor sebenarnya merupaka suatu penelitian yang telah berhasil meletakkan dasar-dasar konsepsi reliabilitas dalam pengembangan formula-formula reliabilitas. Serta memiliki nilai praktis yang sangat tinggi dalam menerangkan masalah reliabilitas dan validitas disamping pemahamannya yang tidak menuntut pengetahuan yang dalam sekali mengenai beberapa fungsi dalam distribusi statistik dan mengenai model matematikanya.

RELIABILITAS DAN MODEL KLASIK SKOR SEBENARNYA
           Dalam istilah praktis reliabilitas adalah sejauh mana deviasi skor individu atau z-skor, tetap relatif konsisten selama pemberian berulang dari tes yang sama atau bentuk alternatif tes. Skor tes dikatakan tideak reliabel, apabila setiap kali ujian sekumpulan item skor tesnya hanya mewakili sampel yang terbatas untuk subset dari item domain yang diberikan pada salah satu kesempatan. Akibatnya skor yang diperoleh di bawah kondisi ini keliru dan tergantung pada kesalahan pengukuran. Kesalahan pengukuran dapat dikategorikan secara acak atau sistematis. Kesalahan pengukuran sistematis adalah mereka yang secara konsisten mempengaruhi skor individu karena beberapa karakteristik khusus dari tes yang tidak ada hubungannya dengan konstruk yang diukur.
MODEL KLASIKAL SKOR SEBENARNYA
Model klasik skor sebenarnya adalah salah satu isu yang paling signifikan dari ketertarikan psikolog Inggris Charles Spearman dengan konsep korelasi. Dari 1904-1913 ia menerbitkan argumen skor tes yang logis dan matematis untuk ukuran sempurna sifat manusia, dan dengan demikian korelasi yang diamati antara nilai tes lebih rendah dari korelasi antara "nilai-nilai obyektif sebenarnya"(Spearman, 1904).
Inti dari model Spearman adalah bahwa setiap skor tes yang diamati dapat dilihat sebagai komposit dari dua komponen hipotetis skor sebenarnya dan komponen kesalahan secara acak, dinyatakan dalam bentuk                            X= T + E
di mana X menunjukkan skor tes terlihat; T, skor true individu;dan E, komponen kesalahan acak. Sebagai contoh, pada tes 10-item, John sebenarnya tahu jawaban atas 7 item 'tapi secara kebetulan 2 jawaban mismark salah, sehingga skor-nya terlihat
X = 7 – 2 = 5
Contoh-contoh numerik mengilustrasikan efek tambahan dari kesalahan pengukuran positif dan negatif, tetapi sebenarnya sangatlah tidak benar menyimpulkan bahwa "true score" dalam ujian seperti yang didefinisikan dalam model klasik skor sebenarnya, adalah beberapa nomor yang dapat menjawab dengan tepat dari item yang diuji.
SKOR TES SEBAGAI VARIABEL ACAK
         Variabel adalah kuantitas yang dapat diasumsikan sebagai salah satu dari serangkaian nilai. Variabel acak dapat didefinisikan sebagai variabel yang mengasumsikan nilai-nilainya sesuai dengan sekelompok probabilitas. Sebagai contoh, anggaplah bahwa Anda akan melempar matu dadu enam sisi. Jumlah spot yang akan muncul pada wajah bagian atas dapat dianggap sebagai variabel acak. Variabel ini dapat mengambil nilai dari 1 sampai 6 menurut seperangkat probabilitas. Nilai ini disebut realisasi dari variabel acak. Meskipun variabel acak hanya menganggap enam nilai, jumlah realisasi dari variabel acak terbatas karena Anda dapat membayangkan melempar mati lagi dan lagi tanpa mempengaruhi itu.
Definisi Skor True
          Variabel acak merupakan distribusi probabilitas, tentang mean dari distribusi tersebut. Nilai yang diharapkan dari variabel acak adalah nama lain untuk rata-rata dari variabel acak. Ketika suatu variabel acak, dilambangkan dengan X, mengasumsikan jumlah terbatas dari nilai-nilai diskrit, nilai yang diharapkan dari  X didefinisikan  sebagai
Dimana   adalah nilai variabel acak dapat diasumsikan, dan adalah probabilitas dari nilai tersebut. Sebagai contoh, jika cetakan persis adil, nilai yang diharapkan akan
            = 1(1/6)+2(1/6)+3(1/6)+(4(1/6)+5(1/6)+(6(1/6)
                                            = 3.5
Jika sebuah variabel acak dapat mengasumsikan jumlah nilai-nilai tak terbatas, equation Persamaan 6.2 tidak dapat digunakan untuk menentukan nilai yang diharapkan. (Simbol aljabar dan proses yang digunakan dalam Persamaan 6.2 akan diganti dengan suatu prosedur yang dikenal sebagai kalkulus integrasi.) Dalam kedua kasus, nilai yang diharapkan dari variabel acak X dinotasikan dengan (X).
Skor sebenarnya (true score) seringkali juga disebut dengan istilah skor universe – skor alam (universe score), adalah nilai hipotesis yang sangat tergantung dari perbedaan individu berkenaan dengan pengetahuan yang dimiliki secara tetap.
Sebagai contoh, apabila seseorang diminta untuk mengerjakan sebuah tes berulangulang, maka rata-rata dari hasil tersebut menggambarkan resultan dari variasi hasil yang tidak ajek. Inilah gambaran mengenai skor sebenarnya. Akan tetapi, di dalam praktek tentu tidak mungkin bahwa penilai minta kepada peserta tes untuk mengerjakan sebuah tes secara berulang-ulang. Gambaran ini hanya untuk menunjukkan contoh saja dalam menjelaskan pengertian skor sebenarnya.

Definisi Error
Menurut model klasik skor true, kesalahan pengukuran adalah mengamati perbedaan antara skor tes dan skor true yang diuji. Kesalahan dalam skor tes untuk j, dengan demikian didefinisikan sebagai
Error, , merupakan variabel acak karena perbedaan antara , variabel acak, dan konstan untuk ujian . Mean dari distribusierror untuk ujian j adalah nilai yang diharapkan
Untuk menyederhanakan ekspresi lebih lanjut menggunakan dua aturan dasar untuk operasi dengan nilai yang diharapkan. Pertama, nilai yang diharapkan dari perbedaan antara dua variabel adalah perbedaan nilai-nilai yang diharapkan. Oleh karena itu, Equation 6.5 dapat ditulis sebagai
Kedua, nilai yang diharapkan dari sebuah konstan hanya konstan; dengan demikian untuk ujian j.
Sekarang, karena (Dari Equation6.3)
Interpretasi bahwa rata-rata dari kesalahan skor untuk diuji selama pengujian banyak mengulangi nol.


Properti Skor True dan Error
Dari definisi sebelumnya untuk memperoleh beberapa prinsip-prinsip dasar dari model klasik skor sebenarnya sering disebut asumsi model. Prinsip-prinsip tersebut:
1.      Rata-rata dari nilai error untuk populasi ujian adalah nol (=0)
2.      Korelasi antara skor true dan error untuk populasi ujian adalah nol ( =.00)
3.      Ketika mengambil ujian dua tes terpisah dan masing-masing nilai diuji pada dua tes (kesempatan dua ujian dengan bentuk yang sama) diasumsikan secara acak dari dua distribusi skor independen, korelasi antara skor error dari dua pengujian adalah nol (=.00)
Ketiga prinsip menjelaskan sifat dasar dari skor true dan skor error untuk menerapkan model klasik skor sebenarnya untuk studi uji reliabilitas.
Rata-rata Skor True dan Error.
Misalkan sekelompok ujian telah melakukan tes. Seperti yang telah kita pelajari, setiap ujian j memiliki satu nilai skor true (), yang merupakan skor rata ujian dari pencobaan mengulangi pada banyak instrumen atau instrumen paralel. Akibatnya, dalam teori, ujian j memiliki seperangkat nilai yang diamati pada tes seperti itu.
Skor rata-rata untuk semua skor true dalam kelompok dilambangkan sebagai
Dimana subscript j pada  menunjukkan bahwa nilai yang diharapkan diambil alih dalam semua kelompok. Jadi kita dapat mendefinisikan , sebenarnya kelompok skor mean, seperti
Simbol ekuivalen ganda dengan mengatakan bahwa skor rata-rata ujian sebenarnya adalah sama dengan rata-rata semua nilai yang diamati yang diterima oleh semua peserta ujian selama mengulangi banyak ujian, atau bahwa
Untuk menemukan skor error untuk kelompok , kita mengikuti prosedur yang sama:
Namun, kita sudah tahu bahwa =0, dan dengan demikian            
Karena nilai yang diharapkan dari sebuah konstan adalah yang konstan maka
Penting untuk diingat bahwa prinsip ini tidak menjamin bahwa setiap kali tes diberikan, rata-rata error peserta ujian' pada tes akan menjadi nol. kolektif untuk semua peserta ujian merupakan populasi error, dengan nilai yang diharapkan (rerata populasi) dari nol. Penyelenggara tes tunggal untuk kelompok ini 200 peserta ujian setara dengan memilih sampel dari nilai-nilai  dengan menggambar satu nilai secara acak dari nilai kesalahan masing-masing tes. Rata-rata dari sampel skor kesalahan tidak nol.
Korelasi Antara Skor True dan Error
Sebuah situasi di mana kita tahu nilai benar dan semua nilai kesalahan untuk setiap peserta ujian dalam suatu populasi. Kami menggunakan skor untuk skala skor pada sumbu vertikal dan nilai skala true pada sumbu horisontal. Perhatikan bahwa masing-masing ujian memiliki banyak nilai kesalahan, tetapi hanya satu skor yang benar, ada jumlah poin yang cukup besar untuk setiap nilai skor true yang diperoleh. Misalkan kita menemukan skor true terendah untuk setiap peserta ujian dalam kelompok. Akan ada satu atau lebih peserta ujian dengan skor true. Untuk setiap ujian dalam populasi, dan konsekuensi  berkala untuk setiap ujian dengan skor true,  = 0. Jadi skor kesalahan untuk semua peserta ujian di skor true akan menjadi nol.
Korelasi Di antara Skor Error
Dua tes yang diberikan setiap ujian' dalam suatu populasi skor kesalahan untuk masing-masing ujian dari kedua ujian. Anggaplah bahwa suatu ujian memiliki skor kesalahan yang positif tinggi pada tes pertama. Ingat bahwa masing-masing skor kesalahan individu pada tes yang diberikan adalah sampel acak dari salah satu distribusi skor kesalahan dengan rata-rata nol. Sebagai hasil dari sampling acak, tidak ada hubungan antara nilai-nilai dari dua nilai kesalahan, dipilih dari dua distribusi independen. Jadi kita melihat bahwa korelasi antara kesalahan dari pengujian yang berbeda adalah nol.



INDEX RELIABILITAS DAN KOEFISIEN RELIABILITAS
Koefisien korelasi yang mengekspresikan derajat hubungan antara nilai benar pada tes dikenal sebagai indeks reliabilitas. Ingat bahwa nilai suatu ujian yang diamati dapat dinyatakan sebagai
X = T + E
Dan dalam skor deviasi sebagai
x = t + e
Bila menggunakan nilai deviasi kita dapat menuliskan ungkapan indeks reliabilitas sebagai '
Dengan mengganti untuk x, ungkapan ini menjadi
Atau
Karena korelasi antara benar dan nilai kesalahan dianggap nol, istilah terakhir dalam Equation 6.14 dapat diabaikan, 2 dan sejak
Kuantitas pertama dalam ekspresi sekarang mewakili PTE, yang sama dengan nol.
yang memudahkan untuk
Jadi kita melihat bahwa indeks reliabilitas dapat dinyatakan sebagai rasio dari standar deviasi dari skor true untuk deviasi standar dari skor teramati. Ketika dua tes memenuhi persyaratan untuk tes paralel, adalah untuk membangun hubungan matematis antara , korelasi antara skor yang benar, dan ', korelasi antara skor yang teramati pada dua tes paralel. Menurut teori klasik skor sebenarnya, dua tes didefinisikan sebagai paralel ketika:
1.      Setiap tes memiliki skor true yang sama pada kedua bentuk tes,dan
2.      Varians kesalahan untuk dua bentuk adalah sama.
Koefisien reliabilitas dapat didefinisikan sebagai korelasi antara skor pada bentuk tes paralel. Bila koefisien reliabilitas didefinisikan dengan cara ini, hubungan antara indeks reliabilitas dan koefisien reliabilitas dapat digambarkan secara matematis.
Selain itu koefesien reliabilitas merupakan suatu yang menggambarkan tinggi rendahnya reliablilitas tes yang dicerminkan oleh koofesien korelasi antara skor pada dua tes parallel.
Biarkan nilai deviasi yang diuji pada dua tes paralel dapat dilambangkan sebagai dan x2. Menurut model, nilai ini dapat dinyatakan sebagai
Dan
x2 = t2 + e2

Deviasi skor Rumus untuk korelasi antara skor tes terlihat dan X2
Dengan substitusi rumusnya menjadi

Melalui pengembangan aljabar, ekspresi menjadi

Di bawah asumsi model klasik skor true, masing-masing dari tiga istilah terakhir dalam ekspresi dapat ditunjukkan dengan nol. Karena nilai-nilai skor yang benar bagi setiap individu diasumsikan sama atas kesempatan pengujian. = oleh tes paralel sehingga definisi
Atau   
Dan kita melihat bahwa koefisien reliabilitas matematis dapat didefinisikan sebagai rasio varians skor benar (kuadrat dari indeks reliabilitas).
Dalam menafsirkan informasi reliabilitas. Hal ini penting untuk dicatat perbedaan antara:
1.      - proporsi varians skor yang disebabkan oleh variasi skor ujian benar' yang terlihat
2.      - kedua proporsi varians skor pada tes paralel terlihat
3.      ---korelasi antara skor yang benar dan skor terlihat
Misalkan laporan pengujian koefisien reliabilitas=0,81. Interpretasi berikut ini akan sesuai. Pertama, kita dapat mengatakan bahwa 81% dari skor varians disebabkan skor varians benar untuk kelompok ujian. Jadi .81. jika deviasi standar dari nilai yang diamati adalah 4 titik, kita akan memprediksi bahwa deviasi standar dari distribusi skor true akan teramati =  atau 3,6 poin. Kedua, kita dapat mengatakan bahwa, atau 65% dari skor varians pada tes kedua bisa diprediksi oleh varians dari skor pada tes pertama. Akhirnya, kita dapat mengatakan bahwa korelasi antara skor terlihat dan nilai yang benar adalahatau .90, untuk ujian ini.
RELIABILITAS KOMPOSIT
Komposit didefinisikan sebagai skor total berdasarkan pada dua atau lebih nilai suubtest. delevoper tes telah menciptakan dua bentuk tes paralel dinotasikan dari A dan dari B. dari froms paralel, koefisien reliabilitas diberikan oleh. (. Sebuah notasi yang umum digunakan untuk menunjukkan reliabilitas ini adalah.) keinginan pengguna tes untuk mengelola kedua forma dan menghitung total skor untuk setiap peserta ujian berdasarkan skor komposit:
C=A+B
Dua metode untuk menentukan skor reliabilitas komposit dalam hal sifat statistik dari komponen. menthod pertama, menggunakan prosedur yang disebut propecy sperman brown, untuk memperkirakan reliabilitas komposit tes paralel reliabilitas dari salah satu tes yang dikenal. Metode scond, menggunakan prosedur yang dikenal sebagai alpha cronbach, untuk memperkirakan reliabilitas komposit dikenal varians skor komposit dan covariances antara semua komponen.


1.      Prophecy Spearman Brown
Untuk memulai derivasi ini, mari kita meninjau beberapa hubungan sederhana yang telah kita pelajari (dapat diturunkan secara logis dari apa yang telah kita pelajari):
1.      Reliabilitas komposit dapat didefinisikan sebagai.
2.      Semua pengukuran paralel dapat ditampilkan untuk memiliki arti sama, standar deviasi yang setara, dan varians yang sama. Selanjutnya, ketika ada pengukuran paralel k, korelasi antara setiap pasang paralel pengukuran ini akan sama dengan korelasi antara pasangan lain.
3.      Jika ada komponen k dalam komposit, varians dari komposit ini akan menjadi jumlah dari istilah varians k dan k(k- 1) istilah kovarians.

Untuk menurunkan rumus reliabilitas komposit. pertama gabungan dari tes paralel k didefinisikan seperti
C=A+B+ ••• +K
Varians skor komposit yang diamati ini kemudian
dimanaadalah jumlah kovarians dari k(k — 1), dan i dan j melambangkan setiap pasangan io; tes dari A ke K. Karena semua tes paralel, semua adalah sama, dan
Oleh karena itu kita dapat menulis ulang persamaan 6.18:
Dengan pemfaktoran keluar dari istilah masing-masing,
Akhirnya kami mencatat bahwa karena i dan j adalah ukuran paralel,sebenarnya dapat dianggap sebagai koefisien reliabilitas tes, sehingga Persamaan 6.19 dapat ditulis
Kami akan menggunakan pernyataan ini sebagai penyebut dari reliabilitas komposit. Sekarang mari kita beralih kevarians skor true untuk komposit C,
Karena skor berlaku untuk setiap peserta ujian harus sama pada tindakan paralel i dan j, untuk semua tes. Selanjutnya, untuk tes paralel,
Oleh karena itu dengan varians k dan kovarians k(k — 1) dalam hal ini komposit skor true,
Hal ini dapat lebih disederhanakan untuk
Penggunaan ekspresi untuk(Persamaan 6.22) dan (Persamaan 6.20),
sekarang kita
dapat menulis persamaan untuk pcc, , sebagai
, dapat disederhanakan

Persamaan 6.23 adalah bentuk umum dari rumus propechy Spearman Brown, menunjukkan bahwa reliabilitas komposit dapat dinyatakan sebagai fungsi dari reliabilitas komponen tunggal (dengan asumsi semua komponen tes paralel).

2.      Reliabilitas Komposit dengan Koefisien Alpha
Reliabilitas komposit sebagai fungsi varians dari skor komposit dan covariances tes komposit. Rumus di sini dikenal sebagai koefisien alpha (Cronbach, 1951). Poin-poin berikut akan membantu pembaca dalam memahami derivasi ini:
1.      Untuk setiap sepasang tes i dan j, kovarians untuk tes ini dilambangkan sebagaiatau
2.      Ketika tes i dan j secara ketat paralel, varians skor dari tes benar saya sama dengan nilai kovarians yang benar pada tes j, atau
3.      Untuk setiap sepasang tes i dan j, kovarians benar skor sama dengan nilai kovarian yang diamati, atau
Berbekal informasi ini, komposit C didefinisikan sebagai jumlah dari nilai subtes paralel k, C= A + B + • • • + K; skor komposit yang benar adalah Tc =. Ingat bahwa varians dari skor komposit yang benar adalah
Dimana i dan j adalah setiap pasangan subyek danadalah jumlah k(k — 1).
Karena semua
langkah paralel k memiliki varians yang sama dan covariances setara dengan satu sama lain,
Selanjutnya, dari titik 2 (di awal bagian) bahwadengan membuat substitusi dalam Persamaan  6.24,

Jika kita menggunakan ekspresi kedua sebagai varians skor komposit, kita dapat menulis ekspresi untuk reliabilitas komposit sebagai
Dalam situasi pengujian, kami tidak pernah bisa yakin bahwa semua tes dalam komposit secara paralel. Dalam hal ini, untuk menggunakan jumlah covariances dan varians komposit untuk memperkirakan batas bawah reliabilitas komposit. untuk reliabilitas koefisien harus lebih kecil dari pada koefisien reliabilitas. Untuk menunjukkan ini, kita harus menetapkan tiga ketidak samaan:
1.      Ketika subyek komposit k tidak paralel, setidaknya akan ada satu subtes (subtes g) nilai varians yang benar lebih besar dari kovarians dengan setiap subset lain, atau
2.      Untuk dua tesis yang tidak paralel, jumlah skor true varians sama dengan dua kali kovarians, atau
3.      Jumlah varians skor true k untuk tes nonparallel lebih besar dari jumlah semua covariances k(k — 1) dibagi dengan (k — 1), atau             ≥ -
Ketidak samaan yang terakhir adalah hasil dari logika memperluas titik 2 di atas tes k. Langkah aljabar dalam Lord dan Novick(1968, hlm89) untuk pembaca yang tertarik. Menambahkan jumlah covariances ke setiap sisi ketidak samaan yang kita miliki

PENGUKURAN STANDAR ERROR
Reliabilitas adalah sebuah konsep pengguna tes untuk menggambarkan proporsi varians skor true dalam skor teramati sebuah kelompok tes. Pengguna tes lebih peduli dengan kesalahan pengukuran yang mempengaruhi interpretasi skor individu. Untuk menentukan jumlah yang tepat dari kesalahan dalam skor yang diberikan, teori tes klasik menyediakan metode untuk mendeskripsikan variasi yang diharapkan dari masing-masing individu yang diuji tentang tes skor true. seperti kelompok total memiliki standar deviasi, distribusi teoritis pribadi masing-masing diuji dari nilai yang diamati untuk skor ujian yang memiliki standar deviasi. Ketika standar deviasi kesalahan rata-rata untuk grup, hasilnya disebut kesalahan standar pengukuran dan dilambangkan sebagai . Sebuah ekspresi untuk kesalahan standar pengukuran dapat disederhanakan dengan menggunakan hubungan
Membagi kedua sisi persamaan ini dengan
Perhatikan istilah pertama dalam ekspresi sebelah kiri adalah definisi sehingga
Untuk menyelesaikan ,perhatikan bahwa
Dan
Jadi jika deviasi standar untuk seperangkat skor tes yang diamati diketahui menjadi 10 poin dan koefisien reliabilitas tes.nilai pengukuran standar error dapat dihitung sebagai berikut:
Dengan asumsi bahwa pengukuran kesalahan acak terdistribusi normal, kita akan mengharapkan sekitar 68% dari nilai ujian untuk di interval, T±1, dan sekitar 95% dari nilai mengamati ujian itu untuk berbohong dalam interval, 1.960, atau dengan pembulatan, 20.

ALTERNATIF DEFINISI SKOR TRUE DAN ERROR
Sampai sekarang, skor yang diuji benar telah ditafsirkan sebagai rata-rata dari sejumlah besar nilai yang diamati diperoleh oleh peserta ujian bahwa dalam pengujian diulang pada tes yang sama atau pada bentuk tes paralel. Salah satu alternatif terkenal melibatkan situasi pengujian tes yang diberikan sebagai salah satu dari banyak bentuk tes yang terdiri dari kolom yang lebih besar item. Dalam kasus tersebut, pengukuran yang diperoleh adalah nilai yang diuji pada bentuk tes tunggal, tetapi kepentingan pengukuran adalah bagaimana ujian itu akan dilakukan.
Sebuah distribusi binomial adalah jenis distribusi frekuensi yang relevan ketika kita mempertimbangkan probabilitas dari 50 lemparan koin 1 dan 49 ekor kepala, 2 pemimpin dan 48 ekor, 3 ekor kepala dan 47, dan seterusnya. Kita tahu bahwa hanya ada dua hasil yang masing-masing melemparkan, dan ada kemungkinan untuk mendapatkan hasil yang baik. Rumus umum untuk distribusi binomial adalah
f(X) =
Tiga sifat dari distribusi binomial yang berguna dalam situasi pengujian kami
1.              suatu distribusi binomial diberikan oleh rumus
2.      Dari suatu distribusi binomial diberikan oleh rumus
3.              Ketika varians dari distribusi harus diestimasi dari sampel data, rumus untuk varians sampel Mean dari suatu distribusi binomial diberikan oleh rumus
Dimana and  adalah probabilitas dari data sampel, dan adalah koreksi untuk mendapatkan estimasi objektif  tentang  varians populasi.
Dalam situasi pengujian yang sebenarnya Alice akan mengambil hanya satu bentuk tes. Jadi kita akan tahu dengan mengamati skor pada tes Xx„, , dan mengamatiproporsi yang benar Pga. Bagaimana informasi ini digunakan untuk memperkirakan kesalahan standar pengukuran nya? Jika kita menganggap proporsi yang benar Pg„, Pascasarjana ", sebagai estimasi dari nilai populasi Pa, kita dapat menggunakan Persamaan 6.33 untuk memperkirakan varians skor Alice pada semua bentuk tes:
Dengan mengingat bahwaPga = Xgaln, dan  = 1 — Pga , sampai pada
Persamaan 6.35 adalah rumus komputasi untuk pengukuran standar error tes acak paralel. Untuk AliceDoe, yang mencetak 80 poin pada bentuk g, terdiri dari 100 item, pengukurannya estimasi standar error
Untuk ujian yang lain, mencetak 50 poin pada tes100- item yang paralel secara acak dari bank item yang sama, kesalahan standar pengukuran estimasi 5,02. Hasil dari dua contoh menggambarkan perbedaan penting antara pengukuran standar error binomial dan model klasik skor benar. Dengan model klasik skor sebenarnya, biasanya hanya satu kesalahan standar pengukuran diperkirakan, tapi berbeda kesalahan standar binomial diperkirakan berbeda untuk skor sebenarnya. Standar error binomial lebih besar untuk nilai yang benar di tengah-tengah rentang skor dan lebih kecil untuk skor pada ekstrem.

DAFTAR PUSTAKA
Azwar. S. 2007. Reliabilitas dan validitas. Yogyakarta: Pustaka Pelajar
Linda C and James A. 1986. Introduction to Classical and Modern Test Theory. United State of America.
Sugiono. 2008. Metode penelitian pendidikan pendekatan kuantitatif kualitatif dan R&D. Bandung: Alfabeta

Arikunto Suharsimi. 2006. Prosedur penelitian suatu pendekatan praktik. Jakarta: Rineka Cipta
Share this article :
 
Comments
0 Comments
Silahkan Tinggalkan Komentar Anda :

Posting Komentar

 
Support : Creating Website | Johny Template | Mas Template
Copyright © 2011. Muhamad Hamdi - All Rights Reserved
Template Created by Creating Website Published by Mas Template
Proudly powered by Blogger