Senin, 22 Juli 2013

MAKALAH VALIDITAS


BAB I
PENDAHULUAN
A.    Latar Belakang
Secara etimologi, evaluasi diartikan sebagai suatu nilai. Sedangkan menurut istilah, sebagaimana yang dikemukakan oleh Edwind Gerald W. Brown (1977) ‘’ evaluation refee to the act or process to determining the value of something”. Menurut definisi ini evaluasi berarti suatu tindakan atau proses untuk menentukan nilai dari sesuatu. Dengan demikian, evaluasi pendidikan diberi pengertian sebagai suatu tindakan, kegiatan atau suatu proses yang berlangsung dalam rangka menentukan nilai dari segala sesuatu dalam dunia pendidikan.
Tes objektif adalah bentuk tes yang mengandung kemungkinan jawaban atau respons yang harus dipilih oleh peserta tes. Pemeriksaan atau penskoran jawaban/respons peserta tes sepenuhnya dapat dilakukan secara objektif oleh pemeriksa dan dapat menggunakan alat bantu.
Ø  Kelebihan Tes objektif :
a.       Lebih representatif mewakili isi dan luas bahan.
b.      Lebih mudah dan cepat memeriksanya.
c.       Pemeriksaan dapat diserahkan orang lain.
d.      Tidak terdapat unsur subjektifitas yang mempengaruhi dalam pemeriksaan maupun penskoran.
Ø  Kelemahan Tes Objektif :
a.       Membutuhkan persiapan yang lebih sukit dari pada tes esai.
b.      Butir soal cenderung hanya mengungkap ingatan dan pengenalan kembali.
c.       Terdapat kesempatan spekulasi dan untung-untungan.

B.     Rumusan Masalah
Mengapa harus ada istilah penilaian dalam pendidikan.?           


C.    Tujuan
Agar mahasiswa mengetahui cara atau langkah-langkah dalam memberikan penilaian terhadap peserta didiknya saat jadi guru.


D.    Manfaat
Mahasiswa dapat memiliki pengetahuan yang lebih luas dan bisa mengaplikasikannya nanti disaat menjai evaluator.

















BAB II
KAJIAN TEORI
A.    VALIDITAS
1.      Pengertian
Validitas berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Dalam kaitannya dengan tes dan penilaian , Retno mengemukakan tiga pokok pengertian yang bisa digunakan sebagai berikut :
1.      Validitas berkenaan dengan hasil dari suatu alat tes atau alat evaluasi, dan tidak menyangkut alat itu sendiri. Tes intelegensi sebagai alat untuk melakukan tes kecerdasan hasilnya valid , tapi kalau digunakan untuk melakukan tes hasil belajar tidak valid.
2.      Validitas adalah persoalan yang menyangkut tingkat (derajat), sehingga istilah yang digunakan adalah derajat validitas suatu tes maka suatu tes ada yang disebut validitasnya tinggi, sedang dan rendah.
3.      Validitas selalu dibatasi pada pengkhususannya dalam penggunaan dan tidak pernah dalam arti kualitas yang umum. Suatu tes berhitung mungkin tinggi validitasnya untuk mengukur keterampilan menjumlah angka, tetapi rendah validitasnya untuk mengukur berfikir matematis dan sedang validitasnya untuk meramal keberhasilan siswa dalam pelajaran matematik yang akan datang.
Validitas adalah kesahihan pengukuran atau penilaian dalam penelitian. Dalam analisis isi, validitas dilakukan dengan berbagai cara atau metode sebagai berikut:
1.      Pengukuran produktivitas (productivity), yaitu derajat di mana suatu studi menunjukkan indikator yang tepat yang berhubungan dengan variabel.
2.      Predictive validity, yaitu derajat kemampuan pengukuran dengan peristiwa yang akan datang.
3.      Construct validity, yaitu derajat kesesuaian teori dan konsep yang dipakai dengan alat pengukuran yang dipakai dalam penelitian tersebut.
2.      Pembagian validitas
Pembagian macam – macam validitas itu, pada dasarnya oleh  para ahli pendidikan melihat pengujian validitas tes itu dari:
1.      Pengujian validitas tes secara rasional
Istilah lain dari validitas rasional adalah validitas logika, validitas ideal atau validitas dassollen. Istilah validitas logika (logical validity) mengandung kata logis berasal dari kata logika yang berarti penalaran.
2.      Pengujian Validitas Tes secara Empiris.
Istilah “Validitas empiris” memuat kata “empiris” yang artinya “pengalaman” sebuah instrumen dapat dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman.
Ada 4 (empat) macam validitas yang berasal dari dasar pembagian jenis di atas yaitu :
a.      Validitas Logis
1)      Validitas Isi (content validity)
Validitas isi dari tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan, penelusuran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar tersebut.
Validitas isi terbagi menjadi dua tipe, yaitu face validity (validitas muka) dan logical validity (validitas logik).
a)      Validitas muka adalah tipe validitas yang paling rendah signifikansinya karena hanya didasarkan pada penilaian terhadap format penampilan (appearance) tes.
b)      Validitas logik disebut juga sebagai validitas sampling (sampling validity). Validitas ini menunjuk pada sejauhmana isi tes merupakan representasi dari ciri-ciri atribut yang hendak diukur.
2)       Validitas Konstruksi (construct validity)
Validitas Konstruksi merupakan tipe validitas yang menunjukkan sejauhmana tes mengungkap suatu trait atau konstruk teoretik yang hendak diukur. Pengujian validitas konstrak merupakan proses yang terus berlanjut sejalan dengan perkembangan konsep mengenai trait yang diukur. Walaupun pengujian validitas konstrak biasanya memerlukan teknik analisis statistika yang lebih kompleks, namun hasil estimasi validitas konstruk tidak dinyatakan dalam bentuk koefisien validitas.

b.      Validitas Empiris
1)      Valditas” ada sekarang” (concurrent validity)
Validitas ini lebih umum dikenal dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika hasilnya sesuai dengan pengalaman. Pengalaman selalu mengenai hal yang telah lampau sehingga data pengalaman tersebut sekarang sudah ada. misalnya seorang guru ingin mengetahui apakah tes sumatif yang di susun sudah valid atau belum. Untuk itu diperlukan sebuah kriterium masa lalu yang sekarang datanya dia miliki misalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu.
2)      Validitas prediksi (predictive validity)
Memprediksi artinya meramal, dan meramal selalu mengenai hal yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki validitas prediksi apabila mempunyai kemampuan untuk meramalkan apa yang akan terjadi pada masa yang akan dating. Validitas prediktif sangat penting artinya bila tes dimaksudkan untuk berfungsi sebagai prediktor bagi performansi di waktu yang akan datang.
3.      Pengujian validitas tes hasil belajar
1.      Pengujian validitas tes secara rasional
Validiras rasional (logika) adalah validitas yang yang diperoleh dari hasil pemikiran, validitas yang diperoleh dengan berfikir secara logis. Dengan demikian maka suatu tes hasil belajar dapat dikatakan telah memiliki valaidiras rasional, apabila telah dilakukan penganalisisan secara rasional ternyata bahwa tes hasil belajar itu memang (secara rasional) dengan tepat telah dapat mengukur apa yang harus diukur.

2.      Pengujian validitas tes secara empiric
Dimaksud dengan validitas empirik adalah ketepatan mengukur yang didasarkan pada hasil analisis yang bersifat empirik. Dengan kata lain, validitas empirik adalah validitas yang bersumber pada atau diperoleh atas dasar pengamatan dilapangan.
4.      Teknik pengujian validitas item tes hasil belajar
1.      Pengertian Validitas Item
Dimaksud dengan validitas item dari suatu tes adalah ketepatan mengukur yang dimiiliki oleh sebutir item, dalam mengukur apa yang seharusnya diukur lewat butir item tersebut

2.      Teknik Pengujian Validitas Item Tes Hasil Belajar
Dari uraian yang telah dikemukakan diatas, kiranya menjadi cukup jelas bahwa sebutir item dapat dikatakan telah memiliki validitas yang tinggi atau dapat dinyatakan valid, jika skor-skor pada butir item yang bersangkutan memiliki kesesuaian atau kesesajaran arah dengan skor totalnya ; atau dengan bahasa statistic: ada korelasi positif yang signifikan antara skor item dengan skor totalnya.
5.      Faktor-faktor yang mempengaruhi Validitas
Menurut Retno ada beberapa hal yang mempengaruhi validitas alat pengukur sebagai berikut :
1.      Faktor di dalam tes itu sendiri
2.       Faktor dalam respon siswa, ini terjadi jika : Siswa mengalami gangguan emosional dalam menjawab tes, Siswa hanya cendrung menerka-nerka dalam menjawab tes,
3.      Faktor dalam mengadministrasi tes dan pembijian.



B.     RELIABILITAS
1.      Pengertian
Reliabilitas didefinisikan sebagai keterandalan alat ukur yang dipakai dalam suatu penelitian. Apakah kita benar-benar dapat mengukur dengan tepat sesuai dengan alat atau instrumen yang dimiliki.
Reliabilitas berarti konsistensi tes mengukur apa yang seharusnya diukur. Realibilitas tes perlu, tetapi tidak memadai sebagai syarat validitas tes. Agar supaya tes valid, maka dia harus reliabel. Namun demikian tes yang reliabel belum tentu valid.
Pada dasarnya, koefisien korelasi (r) menyatakan derajat kesesuaian atau hubungan, antara dua perangkat skor. Dengan demikian, jika individu dengan skor top pada variabel 1 juga mendapatkan skor top pada variabel 2, individu nomor dua pada variabel dua dan seterusnya sampai pada individu paling buruk skornya dalam kelompok, lalu akan ada korolasi sempurna pada variabel 1 dan 2. korelasi seperti akan memiliki nilai + 1,00.
Ada tiga kategori koefisien reliabilitas, yaitu :
1.      Reliabilitas test-Retes
Menggunakan sebuah instrumen, namun diteskan dua kali. Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan yang digunakan yaitu rumus korelasi Pearson.
2.      Reliabilitas Bentuk-Alternatif
Sejak awal peneliti harus sudah menyusun dua perangkat instrumen yang paralel (ekuivalen), yaitu dua buah instrumen yang disusun berdasarkan satu kisi-kisi. Setiap butir soal dari instrumen yang satu selalu harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil kedua instrumen tersebut dihitung korelasinya dengan menggunakan rumus product moment (korelasi Pearson). Korelasi antara skor-skor yang didapatakan pada dua bentuk itu merupakan koefisien reliabilitas tes.
3.      Konsistensi Internal Ukuran Reliabilitas
a.       Reliabilitas Belah-Separuh (Split-Half Reliability).
Peneliti boleh hanya memiliki seperangkat instrumen saja dan hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara membelah seluruh instrumen menjadi dua sama besar.
Dilain pihak dalam reliablitas tes-retes dan reliabilitas bentuk-alternatif, tiap skor didasarkan pada jumlah soal penuh pada tes. Jika semua hal sama, semakin panjang sebuah tes, semakin dapat dihandalkan tes itu. Efek yang akan dihasilkan pada koefisiennya dengan memperpanjang atau memperpendek sebuah tes, dapat diperkirakan dengan rumus Spearman-Browon.

b.      Reliabilitas Kuder-Richardson dan koefisien alpha
Untuk mendapatkan reliabilitas, yang juga menggunakan adminitrasi tunggal dari suatu bentuk tunggal, didasarkan pada konsistensi respons terhadap semua butir soal dalam tes. Konsistensi antar soal ini dipengaruhi oleh dua sumber varians kesalahan, yaitu pencuplikan isi (sebagaimana dalam bentuk-alternatif dan reliabilitas belah-separuh), dan heterogenitas dari domain perilaku yang disampelakan.

c.       Reliabilitas Pemberi Skor
Sekarang seharusnya tampak bahwa berbagai jenis reliabilitas yang berbeda-beda ini bevariasi dalam faktor-faktor yang ada dibawah varians kesalahan. Faktor-faktor yang disingkirkan dari ukuran-ukuran varians keslahan meliputi dua jenis, yaitu faktor-faktor yang variansnya harus tetap ada dalam skor karena faktor-faktor itu merupakan bagian dari perbedaan-perbadaan sejati yang sedang diperhatikan, dan faktor tidak relevan yang dapat dikendalikan secara eksperimental.

d.      Rumus Kuder-Richardson
Tes yang lebih banyak lebih reliabel dari pada tes jumlahnya kecil, hal ini sesui dengan diterapkan dalam rumus Sperman–Brown. Lebih luas dari itu, digunakan indeks homogenitas skor binari item tes. Metode tersebut disebut metode Kunder-Richardson. Rumus K-R 21 kurang akurat dari pada K-R20.

e.       Rumus Koefisien Alpha
Koefisien Alpha lain yang banyak digunakan ukuran homogenitas adalah koefisien alfa juga disebut Lee Cronbach alpha (1951). Koefisien Alpha memiliki aplikasi yang lebih luas dari pada rumus KR 20 dan hasilnya sama dengan ketika kita menggunakan rumus KR 20. Prosedurnya adalah menemukan varians semua skor individu untuk tiap soal dan kemudian menambahkan varians-varians ini sepanjang semua soal.
2.      Standar Error Pengukuran
Realibilitas atau keandalan dari tes juga dapat dinyatakan dalam kesalahan standar pengukuran, yang memberikan perkiraan rentang variasi dalam rangkaian pengukuran yang berulang. Standard error dari pengukuran adalah indeks variabilitas yang diharapkan dalam memperoleh skor.
Dikenal beberapa jenis reliabilitas, yaitu berikut ini.
1.      Intercoder dan intracoder, yaitu pemberian kode dari luar dan dari dalam.
2.      Pretest, yaitu pengujian atau pengukuran perbedaan nilai antara juri-juri pemberi nilai.
3.      Reliabilitas kategori, yaitu derajat kemampuan pengulangan penempatan data dalam berbagi kategori.

Validitas adalah kesahihan pengukuran atau penilaian dalam penelitian. Dalam analisis isi, validitas dilakukan dengan berbagai cara atau metode sebagai berikut.
1.      Pengukuran produktivitas (productivity), yaitu derajat di mana suatu studi menunjukkan indikator yang tepat yang berhubungan dengan variabel.
2.      Predictive validity, yaitu derajat kemampuan pengukuran dengan peristiwa yang akan datang.
3.      Construct validity, yaitu derajat kesesuaian teori dan konsep yang dipakai dengan alat pengukuran yang dipakai dalam penelitian tersebut.


C.    DAYA BEDA
1.      Pengertian
Daya Pembeda merupakan salah satu tujuan analisis kuantitatif soal adalah untuk menentukan dapat tidaknya suatu soal membedakan kelompok dalam aspek yang diukur sesuai dengan perbedaan yang ada dalam kelompok itu. Indeks yang digunakan dalam membedakan antara peserta tes yang berkemampuan rendah adalah indeks daya pembeda (item discrimination).
Indeks diskriminasi item umumnya diberi lambang dengan huruf D (singkatan dari discriminatory power).
Indeks     Dsikriminasi Item (D)
Klasifikasi
Interpretasi
< 0,20
Poor
Butir item yang bersangkutan daya pembedanya lemah sekali (jelek), dianggap tidak memiliki daya pembeda yang baik
0,20 – 0,40
Satisfactory
Butir item yang bersangkutan telah memiliki daya pembeda yang cukup (sedang)
0,40 – 0,70
Good
Butir item yang bersangkutan telah memiliki daya pembeda yang baik
0,70 – 1,00
Excellent
Butir item yang bersangkutan  telah memiliki daya pembeda yang baik sekali
Bertanda negatif (-)
-
Butir item yang bersangkutan daya pembedanya negative sekali (jelek sekali)



Adapun rumus yang digunakan untuk menghitung daya pembeda butir tes adalah sebagai berikut:
DB = U – L
Nup x skor maks
DB = Daya Beda
U = Kelompok Tinggi
L = Kelompok Rendah
Nup = Jumlah siswa Upper dan Lower
Langkah-langkah yang dilakukan untuk menganalisis daya pembeda butir tes adalah sebagai berikut :
1.      Mengurutkan jawaban siswa mulai dari yang tertinggi sampai dengan yang terendah.
2.      Membagi kelompok Atas dan Bawah masing-masing 25 % atau 30 % atau 40 %.
3.      Memberi skor 1 untuk setiap jawaban yang benar dan 0 untuk jawaban yang salah pada tes pilihan ganda. Sedangkan pada tes essay diberikan skor sesuai pada rentangan yang ditentukan.
4.      Menghitung daya beda dengan rumus yang telah ditentukan.

2.      Fungsi Distraktor
Fungsi Distraktor Pada saat membicarakan tes objektif bentuk multiple choice item tersebut untuk setiap butir item yang dikeluarkan dalam tes hasil belajar telah dilengkapi dengan beberapa kemungkinan jawab, atau yang sering dikenal dengan istilah option atau alternatif.

3.      Ukuran Daya Beda Butir
Menurut Davis (1966, hlm 308-312), terdapat kaitan di antara daya beda butir dengan taraf sukar butir. Karena itu, ada kalanya, analisis butir cukup menggunakan daya beda butir untuk menentukan kelayakan butir di dalam alat ukur. Ada sejumlah rumus untuk mengukur daya beda butir. Bentuk paling sederhana adalah perbedaan taraf sukar butir di antara kelompok responden sekor tinggi dan kelompok responden sekor rendah. Namun salah satu bentuk daya beda butir yang banyak digunakan orang adalah korelasi butir-total yakni ρiA untuk butir ke-i. Daya beda butir ini sering dikenal juga dengan istilah validitas butir dan korelasi butir-total.


D.    TINGKAT KESUKARAN
1.      Pengertian Tingkat Kesukaran
Tingkat kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya berkisar 0,00 – 1,00. Semakin besar indeks tingkat kesukaran yang diperoleh dari hasil hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK= 0,00 artinya bahwa tidak ada siswa yang menjawab benar dan bila memiliki TK= 1,00 artinya bahwa siswa menjawab benar. Perhitungan indeks tingkat kesukaran ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat kesukaran butir soal itu. Rumus ini dipergunakan untuk soal obyektif. Rumusnya adalah seperti berikut ini



P = proporsi tingkat kesukaran
Tingkat kesukaran berkisar antara  0,0 --  1,0 dengan klasifikasi sbb;
1. P= 0,00 – 0,30                         sulit
2. P= 0,31 – 0,70                         sedang
3. P= 0,71—1,00             mudah
P = 0,0  Artinya peserta tidak ada yang menjawab betul
P = 1,0  Artinya peserta menjawab betul semua
Tingkat kesukaran PERANGKAT SOAL (seluruh item tes pada soal tsb) dengan rumus sebagai berikut:
P = Tingkat kesukaran naskah soal
b = tingkat kesukaran butir soal
N = jumlah butir soal
Sedang menurut M Ngalim Purwanto (evaluasi pengajaran) tahun 1984 hal 119 untuk menghitung tarap kesukaran sebagai berikut (untuk peserta > 100 orang)
                                             
                                              Ket:
                  TK       =          tingkat kesukaran
                 U           = jumlah siswa yang termasuk kelompok pandai (Upper group)
                                 yang menjawab benar untuk tiap soal.
                  L          = Jumlah siswa yang termasuk kelompok kurang (Lower group)
                                 yang menjawab benar untuk tiap soal.
                  T          = Jumlah Upper dan Lower Group.
Langkah langkah untuk menentukan  Upper dan Lower Group adalah sebagai berikut:
1.      Menyusun urutan peserta tes berdasarkan skor yang diperoleh, dari tinggi ke rendah
2.      Membagi peserta tes tersebut menjadi 2 kelompok yang sama jumlahnya, bila jumlah peserta ganjil maka yang di tengah di buang saja kelompok pertama adalah kelompok atas dan sebaliknya. Bila jumlah peserta lebih dari 50 orang  maka diambil 27% dari kelompok atas dan 27 % dari kelompok bawah.
Untuk mengetahui tingkat kesukaran soal bentuk uraian digunakan rumus berikut ini.


Kemudian dilanjutkan dengan proses berikut
Hasil perhitungan dengan menggunakan rumus di atas menggambarkan tingkat kesukaran soal itu. Klasifikasi tingkat kesukaran soal dapat dicontohkan seperti berikut ini
0,00 – 0,30 soal tergolong sukar
0,31 – 0,70 soal tergolong sedang
0,71 – 1,00 soal tergolong mudah
Tingkat kesukaran butir soal dapat mempengaruhi bentuk distribusi total skor tes. Untuk tes yang sangat sukar (TK<0,25) distribusinya berbentuk positif skewed, sedangkan tes yang mudah (TK>0,80) distribusinya berbentuk negatif skewed.
Tingkat kesukaran butir soal memiliki 2 kegunaan, yaitu kegunaan bagi guru dan kegunaan bagi pengujian dan pengajaran.
Kegunaannya bagi guru adalah:
a.       sebagai pengenalan konsep terhadap pembelajaran ulang dan memberi masukan kepada siswa tentang hasil belajar mereka,
b.      memperoleh informasi tentang penekanan kurikulum atau mencurigai terhadap butir soal yang bias.
Adapun kegunaannya bagi pengujian dan pengajaran adalah:
a)      pengenalan konsep yang diperlukan untuk diajarkan ulang,
b)      tanda-tanda terhadap kelebihan dan kelemahan pada kurikulum sekolah,
c)      memberi masukan kepada siswa,
d)     tanda-tanda kemungkinan adanya butir soal yang bias,
e)      merakit tes yang memiliki ketepatan data soal.
Di samping kedua kegunaan di atas, dalam konstruksi tes, tingkat kesukaran butir soal sangat penting karena tingkat kesukaran butir dapat:
a.       mempengaruhi karakteristik distribusi skor (mempengaruhi bentuk dan penyebaran skor tes atau jumlah soal dan korelasi antarsoal),
b.      berhubungan dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi korelasi antarsoal, semakin tinggi reliabilitas
Tingkat kesukaran butir soal juga dapat digunakan untuk mempredikst alat ukur itu sendiri (soal) dan kemampuan peserta didik dalam memahami materi yang diajarkan guru.
2.      Jenis-Jenis Analisis atau Tingkat Kesukaran Butir Soal
Salah satu tujuan dilakukannya analisis adalah untuk meningkatkan kualitas soal, yaitu apakah suatu soal
a.       Dapat diterima karena telah didukung oleh data statistic yang memadai,
b.      Diperbaiki, karena terbukti terdapat beberapa kelemahan, atau bahkan
c.       Tidak digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama sekali.

1.      Analisis Kualitatif.
Yaitu berupa penelaahan yang dimaksudkan untuk menganalisis soal ditinjau dari segi teknis, isi, dan editorial. Analisis secara teknis dimaksudkan sebagai penelaahan soal berdasarkan prinsip-prinsip pengukuran dan format penulisan soal. Analisis secara isi dimaksudkan sebagai penelaahan khusus yang berkaitan dengan kelayakan pengetahuan yang ditanyakan. Analisis secara editorial dimaksudkan sebagai penelaahan yang khususnya berkaitan dengan keseluruhan format dan keajegan editorial dari soal yang satu ke soal yang lainnya.

2.      Analisis Kuantitatif
Digunakan untuk mengetahui sejauh mana soal dapat membedakan antara peserta tes yang kemampuannya tinggi dalam hal yang didefinisikan oleh kriteria dengan peserta tes yang kemampuannya rendah (melalui analisis statistik).



3.      Tingkat Kesukaran
Ada beberapa alasan untuk menyatakan tingkat kesukaran soal. Bisa saja tingkat kesukaran soal ditentukan oleh kedalaman soal, kompleksitas, atau hal-hal lain yang berkaitan dengan kemampuan yang diukur oleh soal. Namun demikian, ketika kita mengkaji lebih mendalam terhadap tingkat kesukaran soal, akan sulit menentukan mengapa sebuah soal lebih sukar dibandingkan dengan soal yang lain.
Secara umum, menurut teori klasik, tingkat kesukaran dapat dinyatakan melalui beberapa cara diantaranya
a)      Proporsi menjawab benar,
b)      Skala kesukaran linear,
c)      Indeks davis,
d)     Skala bivariat.
e)      Kategori Tingkat Kesukaran


Nilai p
Kategori
P < 0.3
Sukar
0.3 ≤ p ≤ 0.7
Sedang
P > 0.7
Mudah

f)       Tindak Lanjut Hasil Analisis

Interpretasi Item
Tindak Lanjut
Sukar
1.        butir item dibuang atau didrop dan tidak dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang
2.        diteliti ulang, dilacak, dan ditelusuri sehingga dapat diketahui faktor yang menyebabkan butir item yang bersangkutan sulit dijawab oleh testee, apakah kalimat soalnya kurang jelas, apakah petunjuk cara mengerjakan soalnya sulit dipahami, ataukah dalam soal tersebut terdapat istilah-istilah yang tidak jelas, dsb. Setelah dilakukan perbaikan, butir-butir item tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang.
3.        butir-butir yang terlalu sulit dapat digunakan kembali dalam tes (terutama tes seleksi) yang sifatnya sangat ketat.
Sedang
Butir item ini dapat dikeluarkan lagi dalam tes-tes hasil belajar pada waktu-waktu yang akan dating
Mudah
1.        butir item dibuang atau didrop dan tidak dikeluarkan lagi dalam tes-tes hasil belajar yang akan datang
2.        diteliti ulang, dilacak, dan ditelusuri sehingga dapat diketahui faktor yang menyebabkan butir item yang bersangkutan sulit dijawab oleh testee, apakah kalimat soalnya kurang jelas, apakah petunjuk cara mengerjakan solnya sulit dipahami, ataukah dalam soal tersebut terdapat istilah-istilah yang tidak jelas, dsb. Setelah dilakukan perbaikan, butir-butir item tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang.
3.        butir-butir yang terlalu sulit dapat digunakan kembali dalam tes (terutama tes seleksi) yang sifatnya longgar.

2 komentar:

  1. Thanks
    Bisa mampir2 di web pertama qw
    http://febry2298.blogspot.com

    BalasHapus
  2. Thanks
    Bisa mampir2 di web pertama qw
    http://febry2298.blogspot.com

    BalasHapus