BAB I
PENDAHULUAN
A.
Latar
Belakang
Secara
etimologi, evaluasi diartikan sebagai suatu nilai. Sedangkan menurut istilah,
sebagaimana yang dikemukakan oleh Edwind Gerald W. Brown (1977) ‘’ evaluation refee to the act or process to
determining the value of something”. Menurut definisi ini evaluasi berarti
suatu tindakan atau proses untuk menentukan nilai dari sesuatu. Dengan
demikian, evaluasi pendidikan diberi pengertian sebagai suatu tindakan,
kegiatan atau suatu proses yang berlangsung dalam rangka menentukan nilai dari
segala sesuatu dalam dunia pendidikan.
Tes objektif
adalah bentuk tes yang mengandung kemungkinan jawaban atau respons yang harus
dipilih oleh peserta tes. Pemeriksaan atau penskoran jawaban/respons peserta
tes sepenuhnya dapat dilakukan secara objektif oleh pemeriksa dan dapat
menggunakan alat bantu.
Ø Kelebihan
Tes objektif :
a.
Lebih representatif mewakili isi dan luas bahan.
b.
Lebih mudah dan cepat memeriksanya.
c.
Pemeriksaan dapat diserahkan orang lain.
d.
Tidak terdapat unsur subjektifitas yang mempengaruhi
dalam pemeriksaan maupun penskoran.
Ø Kelemahan
Tes Objektif :
a.
Membutuhkan persiapan yang lebih sukit dari pada tes
esai.
b.
Butir soal cenderung hanya mengungkap ingatan dan
pengenalan kembali.
c.
Terdapat kesempatan spekulasi dan untung-untungan.
B. Rumusan
Masalah
Mengapa harus ada
istilah penilaian dalam pendidikan.?
C. Tujuan
Agar mahasiswa
mengetahui cara atau langkah-langkah dalam memberikan penilaian terhadap
peserta didiknya saat jadi guru.
D. Manfaat
Mahasiswa dapat memiliki pengetahuan yang lebih luas
dan bisa mengaplikasikannya nanti disaat menjai evaluator.
BAB II
KAJIAN TEORI
A.
VALIDITAS
1.
Pengertian
Validitas
berasal dari kata validity yang mempunyai arti sejauh mana ketepatan dan
kecermatan suatu alat ukur dalam melakukan fungsi ukurnya. Dalam kaitannya
dengan tes dan penilaian , Retno mengemukakan tiga pokok pengertian yang bisa
digunakan sebagai berikut :
1. Validitas
berkenaan dengan hasil dari suatu alat tes atau alat evaluasi, dan tidak
menyangkut alat itu sendiri. Tes intelegensi sebagai alat untuk melakukan tes
kecerdasan hasilnya valid , tapi kalau digunakan untuk melakukan tes hasil
belajar tidak valid.
2. Validitas
adalah persoalan yang menyangkut tingkat (derajat), sehingga istilah yang
digunakan adalah derajat validitas suatu tes maka suatu tes ada yang disebut
validitasnya tinggi, sedang dan rendah.
3. Validitas
selalu dibatasi pada pengkhususannya dalam penggunaan dan tidak pernah dalam
arti kualitas yang umum. Suatu tes berhitung mungkin tinggi validitasnya untuk
mengukur keterampilan menjumlah angka, tetapi rendah validitasnya untuk
mengukur berfikir matematis dan sedang validitasnya untuk meramal keberhasilan
siswa dalam pelajaran matematik yang akan datang.
Validitas
adalah kesahihan pengukuran atau penilaian dalam penelitian. Dalam analisis
isi, validitas dilakukan dengan berbagai cara atau metode sebagai berikut:
1. Pengukuran
produktivitas (productivity), yaitu derajat di mana suatu studi menunjukkan indikator
yang tepat yang berhubungan dengan variabel.
2. Predictive
validity, yaitu derajat kemampuan pengukuran dengan peristiwa yang akan datang.
3. Construct
validity, yaitu derajat kesesuaian teori dan konsep yang dipakai dengan alat
pengukuran yang dipakai dalam penelitian tersebut.
2.
Pembagian
validitas
Pembagian
macam – macam validitas itu, pada dasarnya oleh
para ahli pendidikan melihat pengujian validitas tes itu dari:
1. Pengujian
validitas tes secara rasional
Istilah lain
dari validitas rasional adalah validitas logika, validitas ideal atau validitas
dassollen. Istilah validitas logika (logical validity) mengandung kata logis
berasal dari kata logika yang berarti penalaran.
2. Pengujian
Validitas Tes secara Empiris.
Istilah “Validitas
empiris” memuat kata “empiris” yang artinya “pengalaman” sebuah instrumen dapat
dikatakan memiliki validitas empiris apabila sudah diuji dari pengalaman.
Ada 4 (empat) macam validitas yang berasal dari
dasar pembagian jenis di atas yaitu :
a.
Validitas Logis
1)
Validitas Isi (content
validity)
Validitas isi dari
tes hasil belajar adalah validitas yang diperoleh setelah dilakukan penganalisisan,
penelusuran atau pengujian terhadap isi yang terkandung dalam tes hasil belajar
tersebut.
Validitas isi terbagi menjadi dua tipe,
yaitu face validity (validitas muka) dan logical validity (validitas logik).
a)
Validitas muka adalah tipe validitas yang paling rendah
signifikansinya karena hanya didasarkan pada penilaian terhadap format
penampilan (appearance) tes.
b)
Validitas logik disebut juga sebagai validitas sampling
(sampling validity). Validitas ini menunjuk pada sejauhmana isi tes merupakan
representasi dari ciri-ciri atribut yang hendak diukur.
2)
Validitas Konstruksi (construct validity)
Validitas
Konstruksi merupakan tipe validitas yang menunjukkan sejauhmana tes
mengungkap suatu trait atau konstruk teoretik yang hendak diukur. Pengujian
validitas konstrak merupakan proses yang terus berlanjut sejalan dengan
perkembangan konsep mengenai trait yang diukur. Walaupun pengujian validitas
konstrak biasanya memerlukan teknik analisis statistika yang lebih kompleks,
namun hasil estimasi validitas konstruk tidak dinyatakan dalam bentuk koefisien
validitas.
b. Validitas Empiris
1)
Valditas” ada
sekarang” (concurrent validity)
Validitas ini lebih umum dikenal
dengan validitas empiris. Sebuah tes dikatakan memiliki validitas empiris jika
hasilnya sesuai dengan pengalaman. Pengalaman selalu mengenai hal yang telah
lampau sehingga data pengalaman tersebut sekarang sudah ada. misalnya seorang
guru ingin mengetahui apakah tes sumatif yang di susun sudah valid atau belum.
Untuk itu diperlukan sebuah kriterium masa lalu yang sekarang datanya dia
miliki misalnya nilai ulangan harian atau nilai ulangan sumatif yang lalu.
2)
Validitas prediksi
(predictive validity)
Memprediksi artinya meramal, dan meramal selalu mengenai hal
yang akan datang jadi sekarang belum terjadi. Sebuah tes dikatakan memiliki
validitas prediksi apabila mempunyai kemampuan untuk meramalkan apa yang akan
terjadi pada masa yang akan dating. Validitas prediktif sangat penting artinya
bila tes dimaksudkan untuk berfungsi sebagai prediktor bagi performansi di
waktu yang akan datang.
3.
Pengujian
validitas tes hasil belajar
1. Pengujian validitas tes secara rasional
Validiras rasional (logika) adalah validitas yang yang
diperoleh dari hasil pemikiran, validitas yang diperoleh dengan berfikir secara
logis. Dengan demikian maka suatu tes hasil belajar dapat dikatakan telah
memiliki valaidiras rasional, apabila telah dilakukan penganalisisan secara
rasional ternyata bahwa tes hasil belajar itu memang (secara rasional) dengan
tepat telah dapat mengukur apa yang harus diukur.
2. Pengujian validitas tes secara empiric
Dimaksud dengan validitas empirik adalah ketepatan mengukur
yang didasarkan pada hasil analisis yang bersifat empirik. Dengan kata lain,
validitas empirik adalah validitas yang bersumber pada atau diperoleh atas
dasar pengamatan dilapangan.
4.
Teknik
pengujian validitas item tes hasil belajar
1.
Pengertian Validitas
Item
Dimaksud dengan validitas item dari
suatu tes adalah ketepatan mengukur yang dimiiliki oleh sebutir item, dalam
mengukur apa yang seharusnya diukur lewat butir item tersebut
2.
Teknik Pengujian Validitas
Item Tes Hasil Belajar
Dari uraian yang telah dikemukakan
diatas, kiranya menjadi cukup jelas bahwa sebutir item dapat dikatakan telah
memiliki validitas yang tinggi atau dapat dinyatakan valid, jika skor-skor pada
butir item yang bersangkutan memiliki kesesuaian atau kesesajaran arah dengan
skor totalnya ; atau dengan bahasa statistic: ada korelasi positif yang
signifikan antara skor item dengan skor totalnya.
5.
Faktor-faktor
yang mempengaruhi Validitas
Menurut Retno ada beberapa hal yang mempengaruhi validitas alat pengukur
sebagai berikut :
1. Faktor
di dalam tes itu sendiri
2. Faktor dalam respon siswa, ini terjadi jika :
Siswa mengalami gangguan emosional dalam menjawab tes, Siswa hanya cendrung
menerka-nerka dalam menjawab tes,
3. Faktor
dalam mengadministrasi tes dan pembijian.
B. RELIABILITAS
1.
Pengertian
Reliabilitas
didefinisikan sebagai keterandalan alat ukur yang dipakai dalam suatu
penelitian. Apakah kita benar-benar dapat mengukur dengan tepat sesuai dengan
alat atau instrumen yang dimiliki.
Reliabilitas
berarti konsistensi tes mengukur apa yang seharusnya diukur. Realibilitas tes
perlu, tetapi tidak memadai sebagai syarat validitas tes. Agar supaya tes
valid, maka dia harus reliabel. Namun demikian tes yang reliabel belum tentu
valid.
Pada dasarnya, koefisien korelasi (r) menyatakan derajat
kesesuaian atau hubungan, antara dua perangkat skor. Dengan demikian,
jika individu dengan skor top pada variabel 1 juga mendapatkan skor top pada variabel 2, individu
nomor dua pada variabel dua dan seterusnya sampai pada individu paling buruk
skornya dalam kelompok, lalu akan ada korolasi sempurna pada variabel 1 dan 2.
korelasi seperti akan memiliki nilai + 1,00.
Ada tiga kategori
koefisien reliabilitas, yaitu :
1. Reliabilitas
test-Retes
Menggunakan sebuah instrumen, namun diteskan dua kali.
Hasil atau skor pertama dan kedua kemudian dikorelasikan untuk mengetahui
besarnya indeks reliabilitas. Teknik perhitungan yang digunakan sama dengan
yang digunakan yaitu rumus korelasi Pearson.
2. Reliabilitas
Bentuk-Alternatif
Sejak awal peneliti harus sudah menyusun dua perangkat
instrumen yang paralel (ekuivalen), yaitu dua buah instrumen yang disusun
berdasarkan satu kisi-kisi. Setiap butir soal dari instrumen yang satu selalu
harus dapat dicarikan pasangannya dari instrumen kedua. Kedua instrumen
tersebut diujicobakan semua. Sesudah kedua uji coba terlaksana, maka hasil
kedua instrumen tersebut dihitung korelasinya dengan menggunakan rumus product
moment (korelasi Pearson). Korelasi antara skor-skor yang didapatakan pada dua
bentuk itu merupakan koefisien reliabilitas tes.
3.
Konsistensi Internal Ukuran Reliabilitas
a.
Reliabilitas
Belah-Separuh (Split-Half Reliability).
Peneliti boleh hanya memiliki seperangkat instrumen saja dan
hanya diujicobakan satu kali, kemudian hasilnya dianalisis, yaitu dengan cara
membelah seluruh instrumen menjadi dua sama besar.
Dilain pihak dalam reliablitas tes-retes dan reliabilitas
bentuk-alternatif, tiap skor didasarkan pada jumlah soal penuh pada tes. Jika
semua hal sama, semakin panjang sebuah tes, semakin dapat dihandalkan tes itu.
Efek yang akan dihasilkan pada koefisiennya dengan memperpanjang atau
memperpendek sebuah tes, dapat diperkirakan dengan rumus Spearman-Browon.
b.
Reliabilitas
Kuder-Richardson dan koefisien alpha
Untuk mendapatkan reliabilitas, yang juga menggunakan
adminitrasi tunggal dari suatu bentuk tunggal, didasarkan pada konsistensi
respons terhadap semua butir soal dalam tes. Konsistensi antar soal ini
dipengaruhi oleh dua sumber varians kesalahan, yaitu pencuplikan isi
(sebagaimana dalam bentuk-alternatif dan reliabilitas belah-separuh), dan
heterogenitas dari domain perilaku yang disampelakan.
c.
Reliabilitas
Pemberi Skor
Sekarang seharusnya tampak bahwa berbagai jenis reliabilitas
yang berbeda-beda ini bevariasi dalam faktor-faktor yang ada dibawah varians
kesalahan. Faktor-faktor yang disingkirkan dari ukuran-ukuran varians keslahan
meliputi dua jenis, yaitu faktor-faktor yang variansnya harus tetap ada dalam
skor karena faktor-faktor itu merupakan bagian dari perbedaan-perbadaan sejati
yang sedang diperhatikan, dan faktor tidak relevan yang dapat dikendalikan
secara eksperimental.
d.
Rumus Kuder-Richardson
Tes yang lebih banyak lebih reliabel dari pada tes jumlahnya
kecil, hal ini sesui dengan diterapkan dalam rumus Sperman–Brown. Lebih luas
dari itu, digunakan indeks homogenitas skor binari item tes. Metode tersebut
disebut metode Kunder-Richardson. Rumus K-R 21 kurang akurat dari pada K-R20.
e.
Rumus Koefisien Alpha
Koefisien Alpha lain yang banyak digunakan ukuran homogenitas
adalah koefisien alfa juga disebut Lee Cronbach alpha (1951). Koefisien Alpha
memiliki aplikasi yang lebih luas dari pada rumus KR 20 dan hasilnya sama
dengan ketika kita menggunakan rumus KR 20. Prosedurnya adalah menemukan
varians semua skor individu untuk tiap soal dan kemudian menambahkan
varians-varians ini sepanjang semua soal.
2. Standar Error Pengukuran
Realibilitas
atau keandalan dari tes juga dapat dinyatakan dalam kesalahan standar
pengukuran, yang memberikan perkiraan rentang variasi dalam rangkaian
pengukuran yang berulang. Standard error dari pengukuran adalah indeks
variabilitas yang diharapkan dalam memperoleh skor.
Dikenal beberapa
jenis reliabilitas, yaitu berikut ini.
3. Reliabilitas
kategori, yaitu derajat kemampuan pengulangan penempatan data dalam berbagi
kategori.
Validitas adalah
kesahihan pengukuran atau penilaian dalam penelitian. Dalam analisis isi,
validitas dilakukan dengan berbagai cara atau metode sebagai berikut.
1. Pengukuran
produktivitas (productivity), yaitu derajat di mana suatu studi menunjukkan
indikator yang tepat yang berhubungan dengan variabel.
3. Construct
validity, yaitu derajat kesesuaian teori dan konsep yang dipakai dengan alat
pengukuran yang dipakai dalam penelitian tersebut.
C. DAYA BEDA
1.
Pengertian
Daya Pembeda merupakan salah
satu tujuan analisis kuantitatif soal adalah untuk menentukan dapat tidaknya
suatu soal membedakan kelompok
dalam aspek yang diukur sesuai dengan perbedaan yang ada dalam kelompok itu. Indeks
yang digunakan dalam membedakan antara peserta tes yang berkemampuan rendah
adalah indeks daya pembeda (item discrimination).
Indeks
diskriminasi item umumnya diberi lambang dengan huruf D (singkatan dari discriminatory
power).
Indeks
Dsikriminasi Item (D)
|
Klasifikasi
|
Interpretasi
|
<
0,20
|
Poor
|
Butir
item yang bersangkutan daya pembedanya lemah sekali (jelek), dianggap
tidak memiliki daya pembeda yang baik
|
0,20
– 0,40
|
Satisfactory
|
Butir
item yang bersangkutan telah memiliki daya pembeda yang cukup (sedang)
|
0,40
– 0,70
|
Good
|
Butir
item yang bersangkutan telah memiliki daya pembeda yang baik
|
0,70
– 1,00
|
Excellent
|
Butir
item yang bersangkutan telah memiliki daya pembeda yang baik
sekali
|
Bertanda
negatif (-)
|
-
|
Butir
item yang bersangkutan daya pembedanya negative sekali (jelek sekali)
|
Adapun rumus yang digunakan untuk menghitung daya
pembeda butir tes adalah sebagai berikut:
DB
= U – L
Nup x skor maks
DB
= Daya Beda
U
= Kelompok Tinggi
L
= Kelompok Rendah
Nup
= Jumlah siswa Upper dan Lower
Langkah-langkah yang dilakukan untuk
menganalisis daya pembeda butir tes adalah sebagai berikut :
1.
Mengurutkan jawaban siswa mulai dari
yang tertinggi sampai dengan yang terendah.
2.
Membagi kelompok Atas dan Bawah
masing-masing 25 % atau 30 % atau 40 %.
3.
Memberi skor 1 untuk setiap jawaban yang
benar dan 0 untuk jawaban yang salah pada tes pilihan ganda. Sedangkan pada tes
essay diberikan skor sesuai pada rentangan yang ditentukan.
4.
Menghitung daya beda dengan rumus yang
telah ditentukan.
2. Fungsi
Distraktor
Fungsi
Distraktor Pada saat membicarakan tes objektif bentuk multiple
choice item tersebut untuk setiap butir item yang dikeluarkan
dalam tes hasil belajar telah dilengkapi dengan beberapa kemungkinan jawab,
atau yang sering dikenal dengan istilah option atau alternatif.
3.
Ukuran Daya Beda Butir
Menurut Davis (1966, hlm 308-312),
terdapat kaitan di antara daya beda butir dengan taraf sukar butir. Karena itu,
ada kalanya, analisis butir cukup menggunakan daya beda butir untuk menentukan
kelayakan butir di dalam alat ukur. Ada sejumlah rumus untuk mengukur daya beda
butir. Bentuk paling sederhana adalah perbedaan taraf sukar butir di antara
kelompok responden sekor tinggi dan kelompok responden sekor rendah. Namun
salah satu bentuk daya beda butir yang banyak digunakan orang adalah korelasi
butir-total yakni ρiA untuk butir ke-i. Daya beda butir ini sering
dikenal juga dengan istilah validitas butir dan korelasi butir-total.
D. TINGKAT KESUKARAN
1.
Pengertian
Tingkat Kesukaran
Tingkat
kesukaran soal adalah peluang untuk menjawab benar suatu soal pada tingkat
kemampuan tertentu yang biasanya dinyatakan dalam bentuk indeks. Indeks tingkat
kesukaran ini pada umumnya dinyatakan dalam bentuk proporsi yang besarnya
berkisar 0,00 – 1,00. Semakin besar indeks tingkat kesukaran yang diperoleh
dari hasil hitungan, berarti semakin mudah soal itu. Suatu soal memiliki TK=
0,00 artinya bahwa tidak ada siswa yang menjawab benar dan bila memiliki TK=
1,00 artinya bahwa siswa menjawab benar. Perhitungan indeks tingkat kesukaran
ini dilakukan untuk setiap nomor soal. Pada prinsipnya, skor rata-rata yang
diperoleh peserta didik pada butir soal yang bersangkutan dinamakan tingkat
kesukaran butir soal itu. Rumus ini dipergunakan untuk soal obyektif. Rumusnya
adalah seperti berikut ini
P
= proporsi tingkat kesukaran
Tingkat kesukaran berkisar antara 0,0 --
1,0 dengan klasifikasi sbb;
1.
P=
0,00 – 0,30 sulit
2.
P=
0,31 – 0,70 sedang
3.
P=
0,71—1,00 mudah
P = 0,0 Artinya peserta
tidak ada yang menjawab betul
P
= 1,0 Artinya peserta menjawab betul
semua
Tingkat kesukaran PERANGKAT SOAL (seluruh item tes pada soal tsb) dengan rumus sebagai berikut:
P = Tingkat kesukaran naskah soal
b = tingkat kesukaran butir soal
N = jumlah butir soal
Sedang menurut M Ngalim Purwanto (evaluasi pengajaran) tahun 1984 hal
119 untuk menghitung tarap kesukaran sebagai berikut (untuk peserta > 100
orang)
Ket:
TK = tingkat
kesukaran
U =
jumlah siswa yang termasuk kelompok pandai (Upper group)
yang menjawab benar untuk tiap soal.
L =
Jumlah siswa yang termasuk kelompok kurang (Lower group)
yang menjawab benar untuk tiap soal.
T = Jumlah Upper dan Lower Group.
Langkah langkah
untuk menentukan Upper dan Lower Group
adalah sebagai berikut:
1.
Menyusun
urutan peserta tes berdasarkan skor yang diperoleh, dari tinggi ke rendah
2.
Membagi peserta tes tersebut menjadi 2
kelompok yang sama jumlahnya, bila jumlah peserta ganjil maka yang di tengah di
buang saja kelompok pertama adalah kelompok atas dan sebaliknya. Bila jumlah peserta lebih dari 50 orang maka diambil 27% dari kelompok atas dan 27 % dari kelompok bawah.
Untuk mengetahui tingkat kesukaran soal
bentuk uraian digunakan rumus berikut ini.
Kemudian dilanjutkan dengan proses
berikut
Hasil perhitungan dengan menggunakan rumus di atas
menggambarkan tingkat kesukaran soal itu. Klasifikasi tingkat kesukaran soal
dapat dicontohkan seperti berikut ini
0,00 – 0,30 soal tergolong sukar
0,31 – 0,70 soal tergolong sedang
0,71 – 1,00 soal tergolong mudah
Tingkat kesukaran butir soal dapat mempengaruhi
bentuk distribusi total skor tes. Untuk tes yang sangat sukar (TK<0,25)
distribusinya berbentuk positif skewed, sedangkan tes yang mudah (TK>0,80)
distribusinya berbentuk negatif skewed.
Tingkat kesukaran butir soal memiliki 2 kegunaan,
yaitu kegunaan bagi guru dan kegunaan bagi pengujian dan pengajaran.
Kegunaannya
bagi guru adalah:
a. sebagai
pengenalan konsep terhadap pembelajaran ulang dan memberi masukan kepada siswa
tentang hasil belajar mereka,
b. memperoleh
informasi tentang penekanan kurikulum atau mencurigai terhadap butir soal yang
bias.
Adapun kegunaannya bagi
pengujian dan pengajaran adalah:
a) pengenalan
konsep yang diperlukan untuk diajarkan ulang,
b) tanda-tanda
terhadap kelebihan dan kelemahan pada kurikulum sekolah,
c) memberi
masukan kepada siswa,
d) tanda-tanda
kemungkinan adanya butir soal yang bias,
e) merakit
tes yang memiliki ketepatan data soal.
Di samping kedua kegunaan di atas, dalam konstruksi
tes, tingkat kesukaran butir soal sangat penting karena tingkat kesukaran butir
dapat:
a. mempengaruhi
karakteristik distribusi skor (mempengaruhi bentuk dan penyebaran skor tes atau
jumlah soal dan korelasi antarsoal),
b. berhubungan
dengan reliabilitas. Menurut koefisien alfa clan KR-20, semakin tinggi korelasi
antarsoal, semakin tinggi reliabilitas
Tingkat kesukaran butir soal juga dapat
digunakan untuk mempredikst alat ukur itu sendiri (soal) dan kemampuan peserta
didik dalam memahami materi yang diajarkan guru.
2.
Jenis-Jenis
Analisis atau Tingkat Kesukaran Butir Soal
Salah satu tujuan dilakukannya analisis adalah
untuk meningkatkan kualitas soal, yaitu apakah suatu soal
a. Dapat
diterima karena telah didukung oleh data statistic yang memadai,
b. Diperbaiki,
karena terbukti terdapat beberapa kelemahan, atau bahkan
c. Tidak
digunakan sama sekali karena terbukti secara empiris tidak berfungsi sama
sekali.
1.
Analisis Kualitatif.
Yaitu
berupa penelaahan yang dimaksudkan untuk menganalisis soal ditinjau dari segi
teknis, isi, dan editorial. Analisis secara teknis dimaksudkan sebagai
penelaahan soal berdasarkan prinsip-prinsip pengukuran dan format penulisan
soal. Analisis secara isi dimaksudkan sebagai penelaahan khusus yang berkaitan
dengan kelayakan pengetahuan yang ditanyakan. Analisis secara editorial
dimaksudkan sebagai penelaahan yang khususnya berkaitan dengan keseluruhan
format dan keajegan editorial dari soal yang satu ke soal yang lainnya.
2. Analisis
Kuantitatif
Digunakan untuk mengetahui sejauh mana soal dapat
membedakan antara peserta tes yang kemampuannya tinggi dalam hal yang didefinisikan oleh kriteria dengan
peserta tes yang kemampuannya rendah (melalui analisis statistik).
3. Tingkat
Kesukaran
Ada beberapa alasan untuk menyatakan tingkat kesukaran
soal. Bisa saja tingkat kesukaran soal ditentukan oleh kedalaman soal,
kompleksitas, atau hal-hal lain yang berkaitan dengan kemampuan yang diukur
oleh soal. Namun demikian, ketika kita mengkaji lebih mendalam terhadap tingkat
kesukaran soal, akan sulit menentukan mengapa sebuah soal lebih sukar
dibandingkan dengan soal yang lain.
Secara umum, menurut teori klasik, tingkat kesukaran dapat dinyatakan melalui
beberapa cara diantaranya
a)
Proporsi
menjawab benar,
b)
Skala
kesukaran linear,
c)
Indeks
davis,
d)
Skala
bivariat.
e) Kategori Tingkat Kesukaran
Nilai
p
|
Kategori
|
P
< 0.3
|
Sukar
|
0.3
≤ p ≤ 0.7
|
Sedang
|
P
> 0.7
|
Mudah
|
f) Tindak Lanjut Hasil Analisis
Interpretasi Item
|
Tindak Lanjut
|
Sukar
|
1.
butir item dibuang atau didrop dan tidak dikeluarkan lagi dalam
tes-tes hasil belajar yang akan datang
2.
diteliti ulang, dilacak, dan ditelusuri sehingga dapat diketahui faktor yang
menyebabkan butir item yang bersangkutan sulit dijawab oleh testee,
apakah kalimat soalnya kurang jelas, apakah petunjuk cara mengerjakan soalnya
sulit dipahami, ataukah dalam soal tersebut terdapat istilah-istilah yang
tidak jelas, dsb. Setelah dilakukan perbaikan, butir-butir item
tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang.
3.
butir-butir yang terlalu sulit dapat digunakan kembali dalam tes (terutama
tes seleksi) yang sifatnya sangat ketat.
|
Sedang
|
Butir
item ini dapat dikeluarkan lagi dalam tes-tes hasil belajar pada
waktu-waktu yang akan dating
|
Mudah
|
1.
butir item dibuang atau didrop dan tidak dikeluarkan lagi dalam
tes-tes hasil belajar yang akan datang
2.
diteliti ulang, dilacak, dan ditelusuri sehingga dapat diketahui faktor yang
menyebabkan butir item yang bersangkutan sulit dijawab oleh testee,
apakah kalimat soalnya kurang jelas, apakah petunjuk cara mengerjakan solnya
sulit dipahami, ataukah dalam soal tersebut terdapat istilah-istilah yang
tidak jelas, dsb. Setelah dilakukan perbaikan, butir-butir item
tersebut dikeluarkan lagi dalam tes hasil belajar yang akan datang.
3.
butir-butir yang terlalu sulit dapat digunakan kembali dalam tes (terutama
tes seleksi) yang sifatnya longgar.
|
Thanks
BalasHapusBisa mampir2 di web pertama qw
http://febry2298.blogspot.com
Thanks
BalasHapusBisa mampir2 di web pertama qw
http://febry2298.blogspot.com