TUGAS
MAKALAH
EVALUASI
PEMBELAJARAN DI SD
KUALITAS ALAT UKUR (INSTRUMEN)
BAB I
PENDAHULUAN
Untuk mengetahui
perkembangan dan kemajuan belajar siswa, perlu dilakukan suatu penilaian dengan
menggunakan berbagai teknik yang tepat. Penilaian dalam pembelajaran dilakukan
tidak hanya untuk menilai hasil belajar siswa melainkan juga menilai proses
belajar siswa. Dalam melakukan penilaian pembelajaran, ada beberapa hal yang
harus diperhatikan guru, terutama yang berhubungan dengan jenis kompetensi yang
akan dinilai, tujuan penilaian yang dilakukan, teknik – teknik penilaian yang
digunakan, dan jenis penilaian yang akan digunakan. Dengan demikian kegiatan
penilaian yang dilakukan menjadi tepet sasaran, terarah, dan terencana.
Secara teoritis
terdapat hubungan timbal balik antara tujuan pembelajaran, proses pembelajaran,
dan penilaian hasil belajar. Jika tujuan pembembelajaran yang dirumuskan sudah
tepat dan proses pembelajaran yang dilakukan sudah maksimal maka salah satu hal
yang perlu kita cermati adalah alat penilaian hasil belajar. Penilaian dapat
didefinisikan sebagai suatu proses untuk mengambil keputusan dengan menggunakan
informasi yang diperoleh melalui pengukuran hasil belajar baik yang menggunakan
instrumen tes maupun non-tes. Jadi maksud penilaian adalah memberikan nilai
tentang kualitas sesuatu. Pengukuran sendiri diartikan sebagai pemberian angka
kepada suatu atribut atau karakteristik tertentu yang dimiliki oleh orang, hal
atau obyek tertentu menurut aturan atau formulasi yang jelas. Dari definisi
tersebut dapatlah ditarik
kesimpulan bahwa pengukuran
memiliki dua karakteristik utama yaitu pertama penggunaan angka atau skala
tertentu, dan kedua menurut suatu aturan atau formula tertentu. Contoh kegiatan
pengukuran adalah ketika kita mengukur tinggi atau berat badan seseorang. Kita
akan mengetahui berapa tingginya atau beratnya. Atribut atau karakteristik yang
kita cari dari contoh pengukuran tersebut yaitu tinggi atau berat, kemudian
hasil pengukuran tersebut kita akan memperoleh angka, misalkan tinggi 1,75
meter atau beratnya 70 kilogram.
Pengukuran dalam
bidang bidang pendidikan bersifat kompleks. Kita hanya mengukur karakteristik
atau atribut tertentu, bukan peserta didik sendiri. Sebagai contoh kita
mengukur kemampuan siswa dalam bidang IPA. Kemampuan ini belum tentu
menggambarkan keseluruhan kepribadian dari siswa sendiri. Kita hanya mengukur
aspek tertentu yang dimiliki oleh siswa. Oleh sebab itu, pengukuran seperti ini
tidaklah sederhana, membutuhkan kemampuan penggunaan alat ukur yang handal yang
benar-benar mampu mengukur kemampuan siswa.
apakah alat ukur yang
anda gunakan ( dalam hal ini tes yang anda susun atau instrumen lain yang anda
gunakan ) mempunyai kualitas yang baik sehingga dapat digunakan untuk mengukur
tujuan pembelajaran yang telah anda tetapkan ?.
Untuk menjawab
permasalahan tersebut, kita akan diajak untuk mempelajari lebih rinci berbagai
cara yang dapat ditempuh untuk meningkatkan kualitas alat ukur atau instrumen
yang anda gunakan agar benar – benar dapat mengukur apa yang ingin anda ukur.
Dalam pembahasan ini akan dibahas mengenai pengujian kualitas alat ukur atau
instrumen yang akan membahas tentang validitas dan reliabilitas hasil
pengukuran dan tentang bagaimana cara menganalisis butir soal dan bagaimana
cara meningkatkan kualitas butir soal berdasarkan hasil analisis serta
bagaimana meningkatkan kualitas alat ukur non-tes.
KUALITAS ALAT UKUR (INSTRUMEN)
KB. 1 VALIDITAS DAN RELIABILITAS HASIL PENGUKURAN
Untuk mengukur sesuatu kita harus dapat memilih alat
ukur yang sesuai agar kita dapat memperoleh hasil pengukuran yang tepat.
Sebagai contoh, seorang pemanah akan dinyatakan sebagai pemenang jika hasil
bidikannya dapat dengan tepat mengenai sasaran yaitu daerah lingkaran yang
paling dalam atau yang paling mendekati lingkaran yang paling dalam. Jika hasil
bidikan peserta didik dapat mengenai daerah di lingkaran paling dalam maka ia
akan memperoleh skor tertinggi dan perolehan skor tersebut semakin berkurang
jika hasil bidikannya jauh dari sasaran. Karena anak panah yang harus
dilepaskan tidak hanya satu maka pemanah dituntut untuk tetap dapat melepaskan
anak panahnya tepat mengenai sasaran.
Hasil bidikan dari peserta bisa tepat mengenai sasaran
atau juga melesat dari sasaran. Hasil yang sama dapat terjadi pada saat anda
mengukur hasil belajar siswa. Jika alat ukur yang anda gunakan tidak anda
persiapkan dengan cermat maka skor yang anda peroleh tidak dapat menggambarkan
dengan tepat tingkat kemampuan siswa. Dari penjelasan tersebut terdapat dua
masalah pokok yang harus diperhatikan dalam menyusun alat ukur hasil belajar
yang baik yaitu masalah yang berhubungan dengan ketepatan hasil pengukuran dan
ketetapan hasil pengukuran. Masalah yang berhubungan dengan ketepatan hasil
pengukuran inilah yang dikenal dengan istilah validitas sedangkan maslah –
masalah yang berhubungan dengan ketetapan hasil pengukuran dikenal dengan
istilah reliabilitas.
A. APAKAH VALIDITAS ITU?
Alat ukur yang baik adalah alat ukur
yang dapat dengan tepat mengukur apa yang ingin diukur. Jika kita ingin
mengukur panjang sebuah meja maka kita harus dapat memilih alat ukur yang tepat
untuk mengukur panjang meja tersebut. Untuk menghitung waktu tempuh pelari
cepat dalam perlombaan lari cepat 100 meter maka kita juga harus dapat memilih
alat ukur yang tepat untuk digunakan. Demikian juga jika kita ingin mengukur
hasil belajar siswa maka kita juga dituntut untuk menggunakan alat ukur ( dalam
hal ini tes ) yang dapat dengan tepat mengukur hasil belajar yang kita
harapkan.
Pengertian validitas mengacu pada ketepatan
interpretasi yang dibuat dari hasil pengukuran atau evaluasi ( Gronlund dan
Linn, 1990). Secra umum validitas ada tiga jenis :
1. Validitas isi ( conten
validity)
2. Validitas konstrak
(construct validity)
3. Validitas yang dikaitkan
dengan kriteria lain ( criteria related,validity).
Validitas isi diperlukan untuk menjawab
pertanyaan “ sejauh mana item – item yang ada dalam tes dapat mengukur
keseluruhan materi yang telah diajarkan “. Tinggi rendahnya validitas isi dapat
ditetapkan berdasarkan analisis rasional atau pertimbangan ahli terhadap isi
tes tersebut. Hal ini merupakan tuntutan yang harus dipenuhi oleh tes hasil
belajar. Tinggi rendahnya validitas isi suatu tes dapat dilihat pada
perencanaan atau kisi – kisi tes. Semakin representatif materi yang dapat
ditanyakan dalam tes tersebut menunjukkan semakin tinggi validitas isinya.
Validitas konstrak mengacu pada
sejauh mana alat ukur tersebut dapat mengungkap keseluruhan konstrak yang
digunakan sebagai dasar dalam penyusunan tes tersebut. Yang dimaksud dengan
konstrak disini adalah konsep hipotesis (hipotetical concept) yang digunakan
sebagai dasar dalam penyusunan alat ukur. Validitas konstrak ini banyak
digunakan terutama dalam pengukuran – pengukuran psikologi seperti pengukuran
sikap, minat, tingkah laku dan sebagainya. Campbell dan Fiske (Demari Mardapi,
2004) mengembangkan satu pendekatan untuk menentukan validitas konstrak dengan
menggunakan teknik multi trait-multi method. Validasi dengan multi trait – multi
method dilakukan dengan menggunakan lebih dari satu metode untuk mengukur lebih
dari satu acam trait ( sifat ). Dengan menggunakan matrik korelasi sehingga
interkorelasi antara trait dan metode dapat dilihat dengan jelas.
Jika suatu tes dimaksudkan untuk memprediksi
keberhasilan seseorang di masa yang akan datang atau dimaksudkan untuk
mengetahui kesesuaian anatar pengetahuan dengan keterampilan yang dimiliki maka
alat ukur yang digunakan harus mempunyai criterion related validity yang
tinggi.
B. APAKAH RELIABILITAS ITU ?
Hasil – hasil pengukuran yang
berhubungan dengan aspek – aspek fisik seperti mengukur panjang meja, tinggi
almari, berat badan dan tinggi badan biasanya menghasilkan reliabilitas yang
sangat tinggi. Artinya walaupun pengukuran dilakukan lebih dari sekali tetapi
tetap memberikan hasil yang ridak jauh berbeda. Hasil pengukuran yenag berbeda
akan sering kita temukan jika kita melakukan pengukuran terhadap hal – hal yang
berhubungan dengan aspek – aspek psikologi dan sosial seperti dalam pengukuran
mewakili intelegensi, sikap, dan konsep diri. Aspek – aspek sosial-psikologi
seperti itu tidak dapat diukur dengan ketepatan dan konsistensi yang tinggi.
Hal ini disebabkan karena hasil pengukuran yang diperoleh tidak dapat lepas
dari pengaruh hal - hal diluar maksud pengukuran tersebut misalnya alat ukur
itu sendiri bukan merupakan alat ukur yang tepat untuk mengukur aspek yang
diinginkan. Disamping itu karena subjek pengukurannya adalah manusia maka cara
– cara penyajian tes, emosi, motivasi. Kondisi fisik dan keadaan ruangan tes
akan mempengaruhi hasil pengukuran walaupun sebenarnya aspek – aspek yang ingin
kita ukur tersebut tidak berubah. Dengan demikian hasil pengukuran yang
diperoleh menjadi kurang reliabel.
Pengertian reliabilitas mengacu pada
ketetapan hasil yang diperoleh dari suatu Pengukuran ( Grondlund dan Linn, 1990
). Salah satu cara untuk mengetahui ketetapan atau reliabilitas suatu
pengukuran, dapat diperoleh dengan cara melakukan pengukuran dua kali. Hasil
pengukuran dikatakan mempunyai reliabilitas yang tinggi jika hasil pengukuran
pertama hampir sama dengan hasil pengukuran kedua. Dan sebaliknya hasil
pengukuran dikatakan mempunyai reliabilitas yang rendah jika hasil pengukuran
pertama jauh berbeda dengan hasil pengukuran kedua. Hubungan antar skor yang
diperoleh pada pengukuran pertama dengan kedua akan menghasilkan angka korelasi
bergerak antara -1 sampai dengan +1. Semakin tinggi angka koefisien
reliabilitas (mendekati 1) maka semakin tinggi reliabilitas tersebut. Suatu perangkat
tes dinyatakan cukup reliabel jika mempunyai reliabilitas lebih besar 0,5
(Fernandes, 1984).
Konsep reliabilitas dalam arti
equivalent tes dimaksudkan untuk mengetahui apakah dua set tes yang digunakan
paralel atau tidak. Keparalelan dua set tes ini diperoleh dengan cara
mengembangkan dua set tes yang paralel dari kisi - kisi tes yang sama kemudian
masing - masing tes tersebut diujikan pada dua kelas yang mempunyai tingkat
kemampuan yang sama. Hasil kedua tes tersebut dikorelasikan, jika hasil korelasinya
tinggi, hal ini menunjukan kedua tes paralel. koefisien korelasinya dapat
dihitung dengan menggunakan formula product-moment.
konsep reliabilitas dalam arti
konsistensi internal dimaksudkan untuk mengetahui apakah kumpulan butir soal
yang ada dalam satu set tes tersebut mengukur dimensi hasil belajar yang sama
atau tidak. Konsep reliabilitas dalam asrti konsistensi dapat dihitung
menggunakan formula Kuder-Richardson (KR-20 atau KR-21). Jika hasil korelasinya
tinggi, hal ni menunjukan bahwa antara butir soal dalam satu set tes tersebut
adalah konsisten dengan yang lain.
C. BAGAIMANA HUBUNGAN
ANTARA VALIDASI DAN RELIABILITASI ?
Ketetapan hasil pengukuran sangat diperlukan untuk memperoleh alat ukur
yang dapat memberikan hasil pengukuran yang tepat (validasi). Walaupun demikian
alat ukur yang memiliki reliabilitasi yang tinggi belum tentu secara otomatis
mempunyai validasi yang tinggi. Karena tingginya reliabilitasi yang dihasilkan
oleh suatu alat ukur jika tidak di barengi demgan tingginya validasi dapat
memberikan informasi yang salah tentang apa yang ingin anda ukur.
D. BAGAIMANA MENINGKATKAN
RELIABILITASI TES ?
Reliabilitasi suatu tes dapat
ditingkatkan dengan menambah jumlah butir kedalam tes tersebut. Penambahan
butir soal pada tes akan meningkatkan reliabilitasi jika butir soal yang
ditambahkan adalah butir-butir soal yang homogen dengan butir soal yang ada.
Butir soal homogen adalah butir soal-soal yang mengukur hal yang sama dengan
butir soal yang ada. Penambahan butir soal tidak akan menaikan reliabilitasi
tes jika butir-butir soal yang ditambahkan tidak homogen dengan butir soal yang
sudah ada.
KB. 2 ANALISIS DAN PERBAIKAN INSTRUMEN
A. MENGAPA
ANALISIS BUTIR SOAL PENTING?
Menurut Nitko (1983) analisis butir soal menggambarkan
suatu proses pengambilan data dan penggunaan informasi tentang tiap-tiap butir
soal terutama tentang respon siswa terhadap setiap butir soal. Lebih lanjut
dikatakan bahwa arti penting penggunaan analisis butir soal adalah sebagai
berikut:
1.
Untuk
mengetahui apakah butir soal-butir soal yang disusun sudah berfungsi sesuai
dengan apa yang dikehendaki oleh penyusun soal. Dalam hal ini perlu anda sadari
bahwa bagaimanapun berpengalamannya seseorang dalam menulis butir soal yang
bersangkutan tidak selalu dapat menulis butir soal yang sempurna. Artinya masih
terbuka peluang bahwa butir soal yang anda susun belum berfungsi sebagaimana
yang anda kehendaki. Untuk menentukan apakah soal-saol yang anda susun telah
berfungsi sebagaimana seharusnya maka anda harus memperhatikan antara lain
hal-hal sebagai berikut:
a.
apakah
soal-soal yang anda susun sudah sesuai untuk mengukur perubahan tingkah laku
seperti telah dirumuskan dalam tujuan intruksional khusus?
b.
apakah
tingkat kesukaran sudah anda perhitungkan?
c.
apakah
soal tersebut sudah mampu membedakan antara siswa yang pandai dengan siswa yang
kurang pandai?
d.
apakah
kunci soal yang anda buat sudah benar sesuai dengan maksud soal?
e.
jika anda
menggunakan tes pilihan berganda, apakah pengecoh yang anda pilih sudah berfungsi
dengan baik?
f.
apakah
soal tersebut masih dapat ditafsirkan ganda atau tidak?
2.
Sebagai
umpan balik siswa untuk mengetahui kemampuan mereka dalam menguasai materi.
3.
Sebagai
umpan balik bagi anda sendiri sebagai guru untuk mengetahui kesulitan-kesulitan
yang dialami siswa dalam memahami suatu materi.
4.
Sebagai
acuan untuk merevisi soal. Dari jawaban yang diberikan siswa terhadap setiap
butir soal anda akan dapat mengetahui kelemahan setiap butir soal sehingga
perlu direvisi. Kegiatan ini sangat penting anda lakukan untuk memperoleh butir
soal yang lebih baik. Karena hanya dengan butir soal yang baiklah anda dapat
mengukur siswa dengan tepat.
5.
Untuk
memperbaiki kemampuan anda dalam menulis soal. Dengan melakukan analisis butir
soal dan melakukan revisi makan kemampuan anda dalam menulis butir soal akan
meningkat.
B. KAPAN
ANALISIS BUTIR SOAL DILAKUKAN?
Dalam menganilis butir soal paling tidak ada dua karakteristik butir
soal yang perlu anda perhatikan yaitu tingkat kesukaran dan daya beda
butir-butir soal.
1.
Tingkat
Kesukaran Butir Soal
Tingkat kesukaran merupakan salah satu karakteristik
yang dapat menunjukkan kualitas butir soal tersebut apakah termasuk mudah, sedang
atau sukar. Suatu butir soal dikatakan mudah jika sebagian besar siswa dapat
menjawab dengan benar dan dikatakan sukar jika sebagian besar siswa tidak dapat
menjawab dengan benar. Besarnya tingkat kesukaran butir soal, dapat dihitung
dengan memperhatikan proporsi peserta tes yang menjawab benar terhadap butir
soal. Secara matematis tingkat kesukaran butir soal dapat dihitung dengan
rumus:
N
keterangan:
p : adalah
indeks tingkat kesukaran siswa
b : adalah
jumlah peserta tes yang menjawab benar n : adalah jumlah seluruh peserta tes.
Contoh:
jika butir soal
nomer 1 yang anda ujikan dapat dijawab dengan benar oleh 10 dari 40 siswa maka
indeks tingkat kebutiran soal nomor 1 tersebut adalah:
40
Indeks tingkat kesukaran butir soal bergerak antara
0,00 sampai dengan 1,00. Indeks tingkat kesukaran butir soal (p) = 0,00 apabila
seluruh peserta tes tidak ada yang dapat menjawab dengan benar dan indeks
tingkat kesukaran butir soal (p) = 1,00 akan tercapai apabila semua peserta tes
menjawab dengan benar. Jadi butir soal yang mudah akan mempunyai (p) mendekati
1,00 dan butir soal yang sukar mempunyai (p) mendekati 0,00.
Menurut Fernandes (1984) kategori tingkat kesukaran butir
soal adalah sebagai beikut:
p ˃ 0,75 : mudah 0,25 ≤ p ≤ 0,75 : sedang
p ˂ 0,24 : sukar
Butir soal yang dianggap sangat bermanfaat (useful) adalah
butir soal yang mempunyai tingkat kesukaran dalam kategori sedang.
2.
Daya Beda
(D)
Daya beda butir
soal memiliki pengertian seberapa jauh butir soal tersebut dapat membedakan
kemampuan individu peserta tes. Butir soal didukung potensi daya beda yang
baik, akan mampu membedakan peserta didik yang memiliki kemampuan tinggi
(pandai) dengan peserta didik yang memiliki kemampuan rendah (kurang pandai).
Daya butir soal
dapat dihitung dengan menggunakan rumus:
D= Pᴀ – Pᴃ
di mana:
D = indek daya
beda butir soal
PA = proporsi
kelompok atas yang menjawab benar PB = proporsi kelompok bawah yang menjawab
benar
misalnya: Dalam menjawab butir soal nomor 2, enam dari 10 siswa yang
termasuk dalam kelompok atas dapat menjawab benar dan dua dari 10 siswa yang
termasuk kelompok bawah dapat menjawab benar makan indeks daya beda butir soal
nomor 2 tersebut adalah:
10 10 10
yang dimaksud dengan siswa kelompok atas adalah kelompok siswa yang
memperoleh skor tinggi sedangkan yang dimaksudkan dengan siswa kelompok bawah
adalah kelompok siswa yang memperoleh skor rendah setelah mengerjakan satu set
tes suatu mata pelajaran.
Nilai indeks daya beda soal bergerak dari -1 sampai +1. Semakin
tinggi indeks daya beda menunjukkan bahwa butir soal tersebut semakin dapat
membedakan antara siswa yang pandai dengan siswa yang kurang pandai.
Secara teoritis
indek daya beda soal (D) = 1 akan tercapai apabila semua siswa kelompok atas
dapat menjawab benar dan semua siswa dalam kelompok bawah menjawab salah.
Indeks daya beda soal (D) = -1 akan tercapai jika semua siswa dalam kelompok
atas menjawab salah dan semua siswa kelompok bawah justru dapat menjawab benar.
Sedangkan indeks daya beda soal (D) = 0
apabila proporsi
siswa yang menjawab benar dalam kelompok atas dan kelompok bawah adalah sama.
Butir-butir soal yang kunci jawabannya
mempunyai indeks daya beda negatif adalah butir soal yang kurang baik karena
butir soal tersebut tidak dapat membedakan siswa yang pandai dengan siswa yang
kurang pandai, dimana siswa yang kurang pandai justru lebih banyak menjawab
benar daripada siswa yang pandai.
Butir soal mempunyai daya beda
yang baik jika dianalisis kuncinya mempunyai daya beda positif dan pengecohnya
mempunyai daya beda negatif. Menurut Fernandes (1984) kategori indeks daya beda
butir soal adalah sebagai berikut:
D ≥ 0,40 = sangat baik 0,30 ≤ D ˂ 0,40 = baik
0,20 ≤ D ˂ 0,30 = sedang
D ˂ 0,20 = tidak baik.
C.
BAGAIMANA CARA MELAKUKAN ANALISIS SECARA SEDERHANA?
Setelah Anda memahami butir soal maka anda
sedah mulai dapat berlatih menganalisis butir soal yang telah anda miliki.
Untuk melakukan analisis butir soal secara sederhana, berikut ini disajikan
langkah-langkah dalam menganalisis butir soal:
1.
Hitunglah
jumlah jawaban yang benar untuk seluruh siswa
2.
Berdasarkan
jumlah jawaban yang benar dari seluruh siswa tersebut susunlah skor siswa mulai
dari skor terendah
3.
Berdasarkan
urutan skor tersebut tentukan siswa yang termasuk dalam kelompok atas dan siswa
yang termasuk dalam kelompok bawah.
Untuk menentukan berapa persen siswa yang termasuk kelompok atas dan berapa
persen yang masuk kelompok bawah gunakan rambu-rambu sebagai berikut ( Nitko, 1983 dan Hanna 1993):
a. Jika jumlah siswa ≤ 20 maka jumlah
kelompok atas dan kelompok bawah masing-masing 50%
b. Jika jumlah siswa 21 – 40 maka jumlah
kelompok atas dan kelompok bawah masing-masing 33,3%
c. Jika jumlah siswa ≥ 41 maka jumlah
kelompok atas dan kelompok bawah masing-masing 27%
4.
Hitunglah
jumlah siswa dalam kelompok atas yang memilih tiap-tiap alternatif jawaban yang
disediakan.
5.
Dengan
cara yang sama hitung jumlah siswa dalam kelompok bawah yang memilih tiap-tiap
alternatif jawaban yang disediakan.
6.
Hitung
jumlah seluruh peserta tes (kelompok atas, tengah, dan bawah) yang menjawab
benar.
7.
Hitung
tingkat kesukaran butir soal dan daya beda dengan menggunakan rumus yang telah
disediakan.
Contoh :
Perhatikan jawaban 100 siswa
terhadap butir soal nomor 1 berikut:
Kelompok |
Alternatif
Jawaban |
Jumlah |
||||
a |
b* |
c |
d |
e |
||
Atas |
5 |
15 |
0 |
0 |
7 |
27 |
Tengah |
|
25 |
|
|
|
|
Bawah |
3 |
7 |
12 |
0 |
5 |
27 |
Catatan:
*Kunci jawaban
Berdasarkan hasil analisis secara sederhana tersebut
nampak bahwa butir soal nomor 1 tersebut mempunyai tingkat kesukaran 0,47 dan
daya beda 0,30. Ini menunjukkan bahwa berdasarkan dua karakteristik tersebut
butir soal nomor 1 cukup baik tetapi apabila anda perhatikan lebih teliti
terhadap pengecoh yang disediakan ternyata alternative jawaban a, d, dan e
perlu diperbaiki. Alternative jawaban a dan e mempunyai daya beda positif. Hal
ini menunjukkan bahwa pengecoh a dan kurang berfungsi sebagai pengecoh yang
baik karena jumlah siswa dalam kelompok atas yang memilih kedua pengecoh tersebut
lebih besar dari jumlah siswa dalam kelompok bawah yang memilih pengecoh yang
sama. Alternatif jawaban d juga perlu diperbaiki karena alternatif jawaban
tersebut tidak ada yang memilih.
D.
BAGAIMANA MENGANALISIS TES URAIAN?
Contoh analisis butir soal yang di bahas di
depan adalah contoh analisis butir soal untuk tes pilihan ganda. Bagaimana
dengan analisis tes uraian?
Cara
menganalisis tes uraian diberikan oleh Whitney dan Sabers (Mehrens dan Lehmann,
1984) sebagai berikut:
1.
Tentukan
jumlah siswa yang termasuk dalam kelompok atas (25%)
2.
Hitung
jumlah skor kelompok atas dan jumlah skor kelompok bawah
3.
Hitung
tingkat kesukaran dan daya beda setiap butir soal dengan rumus berikut :
Dimana:
ƩA : jumlah skor kelompok atas
ƩB : jumlah skor kelompok bawah
N : 25% peserta didik
Skor
mik : Skor maksimal setiap butir tes
Skor
min : skor minimal setiap butir tes
Contoh
:
Perhatikan
tabulasi data hasil tes sumatif IPA untuk butir soal nomor 1 yang diikuti oleh
100 siswa berikut:
Skor Soal |
Kelompok atas |
Kelompok bawah |
||
f |
fs |
f |
fs |
|
7 |
0 |
0 |
0 |
0 |
6 |
0 |
0 |
0 |
0 |
5 |
4 |
20 |
0 |
0 |
4 |
10 |
40 |
4 |
16 |
3 |
6 |
18 |
12 |
36 |
2 |
5 |
10 |
8 |
16 |
1 |
0 |
0 |
0 |
0 |
0 |
0 |
0 |
1 |
0 |
|
25 |
88 |
25 |
68 |
E.
BAGAIMANA MEMPERBAIKI BUTIR SOAL ?
1. Perhatikan tingkat kesukaran butir soal ,soal dianggap baik jika
mempunyai tingkat Kesukaran antara 0,25 sampai 0,75 atau mendekati angka
tersebut.
2. Perhatikan daya beda butir soal.butir soal dianggap baik jika
kunci atau jawaban yang Dianggap benar mempunyai daya beda positif tinggi dan
pengecohnya mempunyai DAya beda negative
Contoh soal :
Jika kita masukan beberapa potong
es kedealam gelas ,beberapa saat kemudian es akan mencair
mengapa es tersebut dapat mencair?
a. Sebab es
terbuat dari air
b. Sebab es
mengalami proses penguapan
c. Sebab es
terkena udara luar yang lebih panas
d. Sebab es lebih
tinggi bdari suhu lingkungan
Sebaran 100 siswa terhadap butir soal tersebut
adalah sebagai berikut :
Kelompok |
Alternatif Jawaban |
Jumlah |
|||
a |
b |
c |
d |
||
atas |
7 |
3 |
17 |
0 |
27 |
Tengah |
|
|
25 |
|
|
Bawah |
7 |
12 |
8 |
0 |
27 |
F. BAGAIMANA MEMPERBAIKI NON TES
* Perbaikan
pertama dapat dilakukan setelah menulis Instrument.
* Uji coba ke
lapangan.
* Analisis hasil
uji coba menggunakan program analisis Instrument
Penyebab butir soal kurang baik anatara
lain
·
Penggunaan
bahasa kurang komunikatif
·
Kalimat
bersifat ambiguous ( dapat ditafsirkan ganda)
·
Pertanyaan
atau pernyataan yang dibuat menyimpang dari Indicator
·
Pertanyaan
atau pernyataan tidak mengukur trait (Sifat ) yang akan diukur.
BAB
III
PENUTUP
Program pengajaran adalah suatu rencana pelaksanaan
proses belajar mengajar yang didasarkan atas pertimbangan tujuan yang ingin
dicapai, bahan, metode, alat, alokasi waktu dan evaluasi agar siswa menguasai
proses belajar dan hasil belajar yang optimal. Kegiatan belajar mengajar adalah
interaksi timbal balik antara guru dengan siswa, siswa dengan siswa, dan siswa
dengan bahan belajarnya. Dan keberhasilan kegiatan belajar mengajar dipengaruhi
oleh kuantitas dan kualitas interaksi yang terjadi pada kegiatan tersebut.
Analisi item merupakan suatu proses pengambilan dan
penggunaan informasi tentang tiap – tiap butir terutama informasi tentang
respons siswa terhadap setiap butir soal. Informasi dari hasil analisis item
sangat bermanfaat bagi guru dan siswa. Bagi guru, hasil analisis item dapat
memeberi informasi kepada guru tentang kualitas butir soal itu sendiri dan
untuk mengetahui materi yang sudah atau belum dikuasai oleh siswa. Bagi siswa
sendiri hasil analisis item dapat menunjukan sampai sejauh mana tingkat penguasaan
materi yang telah dicapai. Analisis item dilakukan pada tes pilihan berganda
dan dapat pula dilakukan pada tes uraian khususnya uraian terbatas. Dua
karakteristik butir soal yang perlu diketahui dalam analisis butir soal adalah
tingkat kesukaran (P) dan daya beda (D). Butir soal yang baik adalah butir soal
yang mempunyai tingkat kesukaran sedang dengan daya beda positif. Butir soal
yang perlu diperbaiki adalah butir soal yang terlalu sukar atau terlalu mudah
dan butir soal yang pengecohnya mempunyai daya beda positif atau kuncinya
mempunyai daya beda negatif. Perbaikan butir soal dapat dilakukan pada pokok
soal atau pada alternatif jawaban.
0 comments:
Post a Comment