Resume Pendidikan

Evaluasi Program dan Instrumen Evaluasi untuk Program Pendidikan dan Penelitian

- Peranan dan Tujuan evaluasi

Evaluasi formal telah memegang peranan penting dalam pendidikan (Worten, Blaine R, dan James R, Sanders, 1987) antara lain memberi informasi yang dipakai sebagai dasar untuk membuat kebijaksanaan dan keputusan, menilai hasil yang dicapai para pelajar, menilai kurikulum, memberi kepercayaan kepada sekolah, memonitor dana tang telah diberikan, memperbaiki materi dan program pendidikan.

- Definisi Evaluasi

Menurut Ralph Tyler, evaluasi merupakan proses yang menentukan sampai sejauh mana tujuan pendidikan dapat dicapai. Menurut Cronbach, Stufflebeam dan Alkin sebagai penyedia informasi untuk pembuat keputusan. Menurut Malclom, provus pencetus Discrepancy Evalution mendefinisikan evaluasi sebagai perbedaan apa yang ada dengan suatu standar untuk mengetahui apakah ada selisih.

Evaluasi dapat mempunyai 2 fungsi, yaitu fungsi formatif, evaluasi dipakai untuk perbaikan dan pengembangan kegiatan yang sedang berjalan (program, orang, produk,dsb). Fungsi sumatif, evaluasi dipakai untuk pertanggung jawaban, keterangan, seleksi atau lanjutan. Jadi evaluasi hendaknya membantu pengembangan, implementasi, kebutuhan suatu program, perbaikan program, pertanggung jawaban, seleksi, motivasi, menambah pengetahuan dan dukungan dari mereka yang terlibat.

Siswa atau mahasiswa sudah merupakan objek yang popular bagi evaluasi pendidikan. Yang lain-lainnya seperti objek atau program institusi pendidikan yang sekarang menjadi objek evaluasi yang semakin populer. Memilih kriteria yang akan dipakai untuk menilai objek evaluasi merupakan tugas yang paling sulit dalam evaluasi pendidikan. Jadi hal-hal yang harus diperhatikan dalam menentukan kriteria penilaian suatu objek ialah:

o kebutuhan, ideal, dan nilai-nilai.

o penggunaan yang optimal dari sumber-sumber dan kesempatan.

o Ketepatan efektifitas training.

o Pencapaian tujuan yang telah dirumuskan dan tujuan penting lainnya.

o Evaluasi dapat mempunyai lebih dari seorang audiensi.

o Masing-masing audiensi mungkin punya kebutuhan yang berbeda.

o Audiensi khusus kebutuhannya harus dirumuskan dengan jelas pada waktu memulai rencana evaluasi.

Evaluasi harus memasukkan ketentuan dan tindakan sejalan dengan fungsi evaluasi yaitu : memfokuskan evaluasi, mendesain evaluasi, mengumpulkan informasi, menganalisis informasi, melaporkan hasil evaluasi, mengelola evaluasi.

Metode yang digunakan dalam evaluasi menggunakan beberapa pilihan yang terbaik sesuai dengan kebutuhan. Provus (1971) dan Stufflebeam (1971) memperkenalkan beberapa variasi metode evaluasi.

Untuk menjadi seorang evaluator yang kompeten dan dapat diandalkan ia harus mempunyai kombinasi berbagai ciri, antara lain: mengetahui dan mengerti teknik pengukuran, dan metode penelitian, mengerti tentang kondisi social dan hakikat objek evaluasi, mempunyai kemampuan human relation, jujur, serta bertanggung jawab. Karena sulit mencari orang yang mempunyai begitu banyak kemampuan, maka sering evaluasi dilakukan oleh suatu tim.

- Model-model evaluasi

Model evaluasi CIPP menurut Stufflebeam dibagi menajdi 4 macam:

  1. contect evaluation to serve planning decision. Konteks evaluasi ini membantu merencanakan keputusan, menentukan kebutuhan yang akan dicapai oleh program, dan merumuskan tujuan program.
  2. input evaluation, structuring decision. Evaluasi ini menolong mengatur keputusan, menentukan sumber-sumber yang ada, alternative apa yang diambil, apa rencana dan strategi umtuk mencapai kebutuhan.
  3. process evaluation, to serve implementing decision. Evaluasi proses untuk membantu mengimplementasikan keputusan.
  4. product evaluation, to serve recycling decision. Evaluasi produk untuk menolong keputusan selanjutnya.

Evaluasi Model UCLA menurut Alkin dibagi menjadi 5macam:

  1. system assessment, yang memberikan informasi tentang keadaan atau posisi system.
  2. program planning, membantu pemilihan program tertentu yang mungkin akan berhasil memenuhi kebutuhan program.
  3. program implementation, yang memberikan informasi apakah program sudah diperkenalkan kepada kelompok tertentu yang tepat seperti yang direncanakan?
  4. program improvement, yang memberikan informasi tentang bagaimana program berfungsi, bagaimana program bekerja, atau berjalan?
  5. program certification, yang memberi informasi tentang nilai atau guna program.

Brinkerhoff mengemukakan 3 golongan model evaluasi, yaitu:

  1. fixed vs emergent evaluation design.

Desain evaluasi yang tetap (fixed) ditentukan dan direncanakan secara sistematik sebelum implementasi dikerjakan. Walaupun desain fixed ini lebih terstruktur daripada desain emergent, desain fixed juga dapat disesuaikan dengan kebutuhan yang mungkin berubah.

  1. formative vs summative evaluation.

Evaluasi formatif digunakan untuk memperoleh informasi yang dapat membantu memperbaiki proyek, kurikulum atau lokakarya. Dibuat untuk digunakan karyawan, dapat juga mengorbankan kepentingan orang luar untuk lebih bermanfaat bagi program.

Evaluasi sumatif. Evalusi sumatif dibuat untuk menilai kegunaan suatu objek. Evaluasi sumatif digunakan untuk menilai apakah suatu program akan diteruskan atau dihentikan saja.

  1. experimental and quasi experimental design vs natural/ unobtrusive inquiry.

Beberapa evaluasi memakai metodologi penelitian klasik. Dalam hal ini, subjek penelitian diacak, perlakuan diberikan, dan pengukuran dampak dilakukan. Tujuan dari penelitian itu yaitu untuk menilai manfaat suatu objek, suatu program atau strategi baru yang dicobakan.

Kriteria penilaian seperti internal dan external validity dianggap penting. Data yang dikumpulkan kebanyakan kuantitatif. Desain penelitian Natural Inquiry. Evaluator menghabiskan banyak waktu untuk mengamati dan berbicara dengan audiensi yang relevan. Strategi yang multiple dan sumber-sumber dipakai untuk mempertinggi reliabilitas pengumpulan data.

- Beberapa pendekatan dalam evaluasi

Pendekatan evaluasi menurut Stecher, Brian M & W. Alan Davis, 1987

1) Pendekatan experimental

Yang dimaksud dengan penedekatan eksperimental yaitu evaluasi yang berorientasi pada penggunaan experimental science dalam program evaluasi. Pendekatan ini berasal dari control eksperimen yang biasanya dilakukan dalam penelitian akademik. Tujuan evaluator yaitu untuk memperoleh kesimpulan yang bersifat umum tentang dampak suatu program tertentu yang mengontrol sebanyak-banyaknya factor dan mengisolasi pengaruh program. Evaluator yang menggunakan pendekatan eksperimental melakukan evaluasi seperti seorang ilmuwan yang melakukan penelitian.

2) Pendekatan yang Berorientasi pada Tujuan (Goal Oriented Approach)

Pendekatan ini memakai tujuan program sebagai criteria untuk menetukan keberhasilan. Evaluator mencoba mengukur sampai di mana pencapaian tujuan telah dicapai. Pendekatan semacam ini merupakan pendekatan yang amat wajar dan praktis untuk desain dan pengembangan program.

Model ini memberi petunjuk kepada pengembangan program, menjelaskan hubungan antara kegiatan khusus yang ditawarkan dan hasil yang akan dicapai. Peserta tidak hanya harus menjelaskan hubungan tersebut di atas, tetapi juga harus menentukan hasil yang diinginkan dengan rumusan yang dapat diukur.

Tidak semua program direncanakan seperti tersebut di atas, merumuskan tujuan dengan cukup jelas. Maka evaluator yang menganut pendekatan ini akan membantu klien merumuskan tujuannya dan menjelaskan hubungan antara tujuan dan kegiatan. Bila ini sudah tercapai maka pekerjaan evaluasi akan menjadi lebih sederhana.

3) Pendekatan yang Berfokus kepada Keputusan (The Decision Focused Approach)

Pendekatan evaluasi yang berfokus pada keputusan, menekankan pada peranan informasi yang sistematik untuk pengelola program dalam menjalankan tugasnya. Sesuai dengan pandangan ini, informasi akan amat berguna apabila dapat membantu para pengelola membuat keputusan. Pengumpulan data dan laporan dibuat untuk menambah efektifitas pengelola program.

Evaluator yang memerlukan 2 macam informasi dari klien. Pertama ia harus mengetahui butir-butir keputusan penting pada setiap periode selama program berjalan. Kedua, ia perlu mengetahui macam informasi yang mungkin akan sangat berpengaruh untuk setiap keputusan.

Keunggulan pendekatan ini ialah perhatiannya terhadap kebutuhan pembuat keputusan yang khusus dan pengaruh yang semakin besar pada keputusan program yang relevan. Keterbatasan pendekatan ini yaitu banyak keputusan penting dibuat tidak pada waktu yang tepat, tapi dibuat pada waktu yang kurang tepat. Seringkali banyak keputusan tidak dibuat berdasarkan data, tapi tergantung pada impresi perorangan, politik, perasaan, kebutuhan pribadi, dll.

4) Pendekatan yang Berorientasi kepada Pemakai (The User Oriented Approach)

Sejak 1970an, evaluasi merupakan suatu komponen standar dari hampir semua program yang dibiayai masyarakat. Para evaluator menjadi sibuk, namun banyak yang merasa kurang puas atas hasil usahanya. Ketidakpuasan ini disebabkan laporan mereka hanya berpengaruh sedikit sekali terhadap program yang mereka evaluasi.

Evaluator menekankan usaha pada pemakai dan cara pemakai dan cara pemakaian informasi. Kelebihan pendekatan ini adalah perhatiannya terhadap individu yang berurusan dengan program dan perhatiannya terhadap informasi yang berguna untuk individu tersebut. Keterbatasan pendekatan ini yaitu ketergantungannya terhadap kelompok yang sama dan kelemahan ini bertambah besar pengaruhnya sehingga hal-hal lain di luar itu kurang mendapat perhatian.

Evaluator yang menganut pendekatan ini harus seorang komunikator yang efektif. Karena interaksi dengan klien dan orang program dapat mempengaruhi kegunaan hasil, kemampuan berkomunikasi amat penting. Bahkan laporan tertentu dibuat dalam bentuk yang akan meningkatkan kegunaannya yaitu: singkat, langsung, laporan akademis, sajian yang dilengkapi dengan gambar dan grafik, bukan dalam bentuk laporan tertulis dengan karangan panjang.

5) Pendekatan yang Responsif (The Responsive Approach)

Pendekatan ini merupakan pendekatan yang paling lain dari kelima bentuk pendekatan yang dibicarakan dalam tulisan ini karena perspektif dalam usulan evaluasi dan metode pencapaiannya. Evaluasi responsif percaya bahwa evaluasi yang berarti yaitu yang mencari pengertian suatu isu dari berbagai sudt pandangan dari dari semua orang yang terlibat, yang berminat, dan yang berkepentingan dengan program.

Evaluasi responsive ditandai oleh ciri-ciri penelitian yang kualitatif, naturalistik, bukan kuantitatif. Bukan mengumpulkan data dengan instrument tes atau kuesioner, tapi evaluator mengandalkan observasi yang langsung atau tidak langsung terhadap kejadian dan interpretasi data yang impresionistik. Evaluator mengobservasi, merekam, menampi data, mengecek pengetahuan awal (preliminary understanding) peserta program, dan mencoba membuat model yang mencerminkan pandangan berbagai kelompok.

Kelebihan pendekatan responsive adalah kepekaannya terhadap berbagai titik pandangan, dan kemampuannya mengakomodasi pendapat yang ambigis dan tidak focus. Pendekatan responsive dapat berorientasi dalam situasi dimana terdapat banyak perbedaan minat dari kelompok yang berbeda-beda, karena mereka dapat mengatur pendapat tersebut dengan cara yang tepat.

Keterbatasan pendekatan ini adalah keenganannya membuat prioritas atau penyerdehanan informasi untuk pemegang keputusan dan kenyataan yang praktis tidak mungkin menampung semua sudut pandangan dari berbagai kelompok. Pengaruh pendekatan ini terhadap pemfokusan evaluasi ialah evaluator menghabiskan banyak waktu berbicara dengan klien, mengamati kegiatan program, mencoba menyaring hal-hal yang dipandang penting dari klien, dan masalah-masalah, konsep-konsep dan isu-isu dari berbagi sudut pandangan.

6) Goal Free Evaluation

Alasan mengemukakan evaluasi goal free evaluation (evaluasi bebas tujuan), dapat diuraikan secara singkat sebagai berikut : pertama, tujuan pendidikan tak dapat dikatakan sebagai pemberian, seperti tujuan lain, ia harus dievaluasi. Lebih jauh lagi, tujuan biasanya atau umumnya hanya formalitas, dan jarang menunjukkan tujuan yang sebenarnya dari proyek, atau tujuan berubah. Dalam evaluasi yang berorientasi pada tujuan, seorang evaluator diberitahu tujuan proyek dan karenanya membatasi dalam persepsinya, tujuan berlaku sebagai penutup mata (blinders), yang menyebabkannya melewati hasil penting yang langsung berhubungan dengan tujuan.

Dampak negative yang tak pernah termasuk dalam evaluasi yang berorientasi pada tujuan atau goal based evaluation. Berikut ini merupakan cirri-ciri evaluasi bebas tujuan :

    1. Evaluator sengaja menghindar untuk mengetahui tujuan program.
    2. Tujuan yang telah dirumuskan terlebih dahulu tidak dibenarkan menyempitkan focus evaluasi.
    3. Evaluasi bebas tujuan berfokus pada hasil yang sebenarnya, bukan pada hasil yang direncanakan.
    4. Hubungan evaluator dan manajer atau dengan karyawan proyek dibuat seminimal mungkin.
    5. Evaluasi menambah kemungkinan ditemukannya dampak yang tak diramalkan.

- Beberapa konsep dalam evaluasi

1) Evaluasi Formatif dan Sumatif

Evaluasi formatif dilaksanakan selama program berjalan untuk memberikan informasi yang berguna kepada pemimpin program untuk perbaikan program. Misalnya, selama pengembangan program paket kurikulum, evaluasi formatif akan melibatkan pemeriksaan konten oleh ahli, pilot tes terhadap sejumlah siswa, tes lapangan terhadap siswa yang lebih banyak dan dengan guru di beberapa sekolah, dsb.

Evaluasi sumatif dilakukan pada akhir program untuk memberi informasi kepada konsumen yang potensial tentang manfaat atau kegunaan program. Misalnya, sesudah paket kurikulum dikembangkan, evaluasi sumatif mungkin dilaksanakan untuk menentukan efektifitas paket tersebut pada tingkat nasional atas sample sekolah khusus, guru dan siswa pada tingkat perkembangan tertentu.

Kedua evaluasi ini sangat penting karena keputusan diperlukan selama proses, tingkat, pengembangan proyek, untuk memperbaiki dan memperkuat lagi sesudah stabil, untuk menilai manfaat atau menentukan masa depan program. Kegagalan melakukan evaluasi formatif merupakan suatu kerugian karena data evaluasi formatif diperoleh lebih dulu, hal ini dapat menolong penyusunan jadwal kembali, pengaturan uang dan semua hal seperti moril dan materiil dapat diarahkan ke arah yang lebih produktif.

Baker (1978) mengatakan ada 2 faktor yang mempengaruhi kegunaan evaluasi formatif yaitu kontrol dan waktu. Bila saran perbaikan akan dijalankan, maka evaluasi formatif diperlukan sebagai kontrol. Informasi yang diberikan terlambat kepada administrator akan sia-sia.

2) Evaluasi Internal dan Evaluasi Eksternal

Tujuan

Audiensi

Siapa yang melakukan

Ciri-ciri umum

Mengukur

Frekuensi peng data

Ukuran sample

Pertanyaan

Desain

Hambatan

Evaluasi Formatif

Memperbaiki program

Adm. Program, karyawan

Evaluator internal

Tepat waktu

Sering informal

Sering

Sering kecil

Apa yang sedang dikerjakan? Apa yang perlu diperbaiki? Bagaimana akan diperbaiki?

Evaluasi Sumatif

Menilai manfaat program

Konsumen, sponsor

Evaluator eksternal

Meyakinkan

Valid/ reliable

Terbatas

Biasanya besar

- apa hasilnya?

- dengan siapa?

- dalam kondisi bagaimana?

- penataran yang mana?

- akibatnya?

Apa tuntutannya

Selain evaluasi sumatif dan formatif, ada pembagian lain yaitu evaluasi internal dan eksternal, sesuai dengan namanya, evaluasi internal dilakukan oleh evaluator dari dalam proyek, dan evaluasi eksternal dilakukan dari evaluator dari luar. Evaluator internal tentu mengetahui lebih banyak tentang programnya daripada orang luar, atau evaluator eksternal, tetapi mungkin ia begitu dekat dengan program sehingga mungkin agak sulit untuk menjadi objektif 100%. Evaluator internal lebih banyak tahu hal-hal yang bersifat konteks (seperti istri direktur menderita sakit yang serius, sehingga efektivitas kerja suaminya sebagai direktur sering terganggu).

Dimensi evaluasi formatif dan evaluasi sumatif dapat dikombinasikan dengan dimensi evaluasi ekstenal dan internal. Kombinasi ini bertujuan untuk menghindari keterbatasan yang ada pada masing-masing dimensi dan mengambil manfaat dan kelebihan-kelebihannya..

- Memfokuskan evaluasi

Memfokuskan evaluasi yaitu mengkhususkan apa dan bagaimana evaluasi akan dilakukan. Fokus evaluasi berarti melihat beberapa variable dengan teliti. Biasanya variable ini termasuk objek yang akan dievaluasi, tujuan evaluasi, individu yang akan terlibat, latar belakang dan pengaruhnya pada evaluasi, serta pertanyaan-pertanyaan penting yang harus dijawab oleh evaluasi untuk mencapai tujuan evaluasi.

Bila evaluasi sudah terfokus, maka ini berarti proses dan desain dimulai. Ketentuan-ketentuan pada tahap ini harus diperhatikan dengan teratur untuk diubah apabila sewaktu-waktu ada perubahan pada objek, wadah, dan individu yang terlibat.

Objek evaluasi yaitu apa yang akan dievaluasi, dapat berupa program, proyek, training, atau bahkan evaluasi yang lain. Apa pun dapat menjadi objek evaluasi. Tugas merumuskan dan menjelaskan objek yang akan dievaluasi tampaknya mudah dan sederhana, tapi malah sebaliknya. Kenyataannya justru merupakan tugas yang paling sulit dan merupakan tanggung jawab yang penting. Ini disebabkan karena :

(1) Objek yang dievaluasi tidak statis, misalnya dalam suatu program, objek tersebut sedang berjalan, dapat saja dipengaruhi oleh kejadian di dalam maupun di luar dan terus berubah.

(2) Objek tampak berbeda, di satu pihak administrator melihat begini, sedangkan klien begitu.

Oleh sebab itu, perlu ada kesepakatan tentang apa yang akan dievaluasi sebelum mendesain evaluasi. Dan tujuan evaluasi harus dirumuskan dengan jelas.

- Proses Pemfokusan

Dalam proses pemfokusan hal yang biasany dilakukan adalah diskusi antara evaluator dan sponsor yang biasanya membicarakan tujuan utama evaluasi, prosedur yang akan dilalui dan interaksi yang akan dilakukan selama evaluasi. Bila anda memfokuskan evaluasi, anda memperjelas pengertian tentang kebutuhan dan keinginan personel program dan sponsor, dan pengertian mereka tentang pengalaman dan kemampuan anda sebagai evaluator.

Proses ini memerlukan banyak diskusi, mungkin dengan tatap muka, melalui telepon atau surat-menyurat. Kadang-kadang apabila anda sebagai evaluator sangat berbeda pendapat tentang tujuan dan prosedur evaluasi dengan seorang sponsor yang potensial, mungkin anda akan memilih lebih baik mengundurkan diri saja.

- Kerangka Pemfokusan Evaluasi

Pemfokusan evaluasi merupakan tugas yang agak rumit, karena melibatkan karena melibatkan negosiasi orang-orang yang tidak selalu mempunyai pengetahuan dan sikap yang sama tentang apa yang mereka diskusikan dan yang tidak menempatkan nilai-nilai pada wadah dan hasil yang sama. Lebih-lebih ini merupakan interaksi antara manusia, dimana banyak sekali kehendak dan seluk-beluknya yang bervariasi. Hal ini memang harus disadari yang merupakan hal yang kompleks atau rumit dan ini timbul selalu dalam pemfokusan evaluasi, oleh sebab itu perlu disederhanakan.

- Elemen-elemen Proses Pemfokusan

Ada tiga elemen dalam proses pemfokusan (Stecher Brian M & W. Alan Davis)

    1. Mempertemukan pengetahuan dan harapan

Telah dikatakan bahwa proses pemfokusan evaluasi telah terjadi sebelum klien dan evaluator bertemu. Masing-masing datang ke rapat dengan pengetahuan dan harapan yang telah ada sebelumnya. Setiap evaluator mempunyai konsep sendiri tentang evaluasi. Apakah evaluasi merupakan evaluasi yang mengevaluasi kelompok kontrol dan dengan analisis statistik? Apakah evaluasi merupakan usaha untuk menilai pencapaian tujuan?.

    1. Mengumpulkan informasi

Elemen kedua dalam proses pemfokusan yaitu pengumpulan informasi. Kedua pihak, baik evaluator maupun klien harus banyak belajar tentang hal ini. Evaluator harus akrab, maksudnya harus banyak tahu tentang program yang akan dievaluasi, kebutuhan dan harapan klien, individu dan kelompok yang harus dilibatkan dan keterbatasan-keterbatasan yang berupa waktu, sumber-sumber dan keterbatasan-keterbatasan lainnya. Klien ingin mengetahui tentang kemampuan evaluator dan evaluasi yang akan membantu mereka.

Pertama, keterangan tentang program. Siapa peserta program? Pelayanan-pelayanan apa yang diberikan? Kedua, evaluator harus tahu apa yang diinginkan klien. Mengapa diadakan evaluasi? Bagaimana hasil evaluasi akan dipakai? Ketiga, dalam tahap pengumpulan informasi ini, perlu kiranya diketahui apakah ada individu atau kelompok lain yang berminat atas hasil evaluasi.

Akhirnya, evaluator biasanya akan berusaha untuk menemukan apa sumber-sumber yang dapat dimanfaatkan, dan apa keterbatasan-keterbatasan yang mungkin akan dihadapi yang akan membatasi ruang gerak evaluasi.

Evaluator perlu mengetahui keterbatasan-keterbatasan yang mungkin dapat muncul selama evaluasi dilakukan. Selagi evaluator menyusun strategi, evaluator perlu ada untuk melakukan kegiatan evaluasi.

    1. Merumuskan rencana evaluasi

Apa sebenarnya rencana evaluasi itu? Yang dimaksud ialah persetujuan umum antara evaluator dan klien yang menjelaskan isu-isu penting evaluasi. Rencana itu biasanya awal dari penandatanganan persetujuan. Biasanya merupakan lisan, bukan tertulis. Paling tidak, rencana evaluasi yang baik yaitu menjelaskan tiga hal, yakni pertanyaan-pertanyaan evaluasi, prosedur, dan biaya.

Pertama, pertanyaan-pertanyaan mungkin dirumuskan dalam bentuk yang khusus, misalnya : Apakah siswa memperoleh hasil yang lebih baik dengan memakai tujuan sebanyak 75% dari yang direncanakan?. Kedua, evaluator harus menjelaskan prosedur yang ditempuh dalam kegiatan evaluasi. Apakah akan membuat kuesioner?. Ketiga, evaluator harus memyetujui biaya evaluasi secara umum. Evaluator harus dapat memperkirakan jumlah biaya yang akan diperlukan untuk melakukan kegiatan yang telah dirundingkan.

- Hal-hal yang perlu diingat dalam pengumpulan Informasi

Pengumpulan informasi merupakan hal yang poko dalam evaluasi. Apabila semua program sosial sama, atau apabila suatu pendekatan dapat dipakai untuk semua program, maka tenti tidak perlu mengumpulkan informasi yang terlalu khusus dan banyak tentang suatu program setiap akan mengevaluasi.

Perlu diperhatikan bahwa informasi dalam jangka waktu tertentu akan berubah dan tidak statis, begitu juga metode pengumpulan data perlu diubah sesuai dengan kondisi dan situasi proyek dan sumber yang ada. Yang paling penting tepat yaitu memilih informasi yang paling tepat untuk menjawab pertanyaan evaluasi. Informasi yang dikumpulkan harus relevan dengan pertanyaan yang telah dirumuskan, informasi harus cukup banyak untuk menjawab pertanyaan-pertanyaan evaluasi.

Kesalahan informasi dapat dihindari apabila evaluator mengikuti atau membuat rencana yang mantap untuk mengumpulkan data. Sebagai evaluator ia harus mengetahui sebanyak-banyaknya tentang program yang akan dievaluasi. Tujuan evaluasi, siapa kliennya, keterbatasan waktu, biaya, dan kemungkinan memperoleh informasi sebelum sampai pada rencana evaluasi dan melakukannya.

Tiga komponen informasi berdasarkan Brian M. Stecher & W. Alan Davis (1987):

- Apa programnya?

Keakraban dengan orang-orang proyek dan pengenalan yang tuntas tentang program yang akan dievaluasi merupakan syarat yang mutlak. Evaluator harus menyediakan waktu untuk mendengar segala sesuatu tentang program dari orang-orang proyek. Yang paling penting pada dasarnya yang harus diketahui ialah :

(1) Siapa yang akan mendapat manfaat program?

(2) Siapa ynag mengerjakan program tersebut?

(3) Apa yang mereka lakukan?

- Apa yang dievaluasi?

Tujuan evaluasi antara lain sebagai pekerjaan rutin dan tanggung jawab rutin, untuk membantu pekerjaan manajer dan karyawan dengan tujuan yang lebih banyak, dan informasi yang lebih lengkap dari yang sudah ada, atau memberikan informasi untuk tim pembina atau penasihat, untuk klien, untuk dewan direktur, atau pemberi dana atau sponsor.

Evaluator juga harus ingat bahwa suatu evaluasi sering mempunyai audiensi yang potensial. Seperti klien, karyawan, pimpinan, pemberi dana, dan public yang berminat langsung atas hasil evaluasi, terutama program-program sosial. Kelompok-kelompok tersebut biasanya mempunyai kebutuhan yang berbeda untuk sudut pandangan yang berbeda.

- Apa keterbatasan-keterbatasan evaluasi?

Evaluator perlu menentukan apa yang dapat dikerjakan dan apa yang tak dapat dilakukan. Ruang lingkup evaluasi dibatasi oleh pertimbangan-pertimbangan yang praktis, biasanya karena uang. Uang biasanya diartikan sebagai waktu dalam proses evaluasi, tetapi batasan waktu juga perlu dipertimbangkan. Sering dana program menentukan jadwal untuk evaluasi dan menentukan batas akhir untuk menyelesaikannya.

Dipakainya suatu informasi mungkin menyebabkan keterbatasan yang lain, misalnya : survey kepada peserta yang terdahulu, mungkin dapat memberikan informasi yang berguna, namun mungkin juga tidak praktis karena tergantung dari mobilitas dan keberadaan peserta yang terdahulu.

- Desain Evaluasi Program

Desain evaluasi program (Carol Tayler Fitz-Gibbon & Lynn Lyons Morris, 1987), suatu desain ialah rencana yang menunjukkan bila evaluasi akan dilakukan dan dari siapa evaluasi atau informasi akan dikumpulkan selama proses evaluasi. Alasan utama memakai desain yaitu untuk meyakinkan bahwa evaluasi akan dilakukan menurut aturan evaluasi yang baik. Pekerjaan evaluator berkisar antara mengambil salah satu atau keduanya, tergantung dari tugas yang diberikan.

(1) Bila seorang evaluator diminta membuat laporan singkat tentang keefektifan suatu program. Dalam hal ini mungkin evaluasi akan memberi laporan misalnya, kepada pemberi dana, pemerintah, organisasi, atau institute yang memintanya untuk mengevaluasi program tertentu.

(2) Tugas evaluator mungkin sebagai penolong dan penasihat terhadap perencana program dan mungkin sebagai perencana itu sendiri, evaluator akan diminta untuk melihat masalah yang potensial, hal-hal yang perlu diperbaiki, memonitor kegiatan program dan secara teratur melakukan tes untuk mengetahui perubahan perilaku dsb.

1. Desain dalam Evaluasi Sumatif

Biasanya desain dihubungkan dengan evaluasi sumatif, evaluator sumatif diharapkan membuat kesimpulan umum, menyingkat dan membuat laporan tentang keberhasilan program. Karena laporan tersebut dapat mempengaruhi keputusan tentang masa depan program atau nasib orang lain, maka evaluator perlu mendukung penemuannya dengan data yang cukup tepercaya.

Evaluasi sumatif sebaiknya memakai desain eksperimen apabila meneliti program yang akan dievaluasidengan hasil evaluasinya. Evaluasi sumatif yang paling baik yaitu evaluasi yang mempunyai cirri-ciri penelitian yang baik, maksudnya yang mempunyai persyaratan penelitian lengkap. Evaluasi yang memakai instrument dengan validitas dan realibitas yang tinggi.

Tujuan evaluator ialah mencari penemuan tentang program yang dapat digeneralisasikan kepada situasi lain di luar program yang dievaluasi. Tugas evaluator adalah memberi informasi tentang baik buruknya program, mengingatkan mereka bahwa adalah tidak benar memutuskan sesuatu yang penting hanya dengan satu atau dua hasil penelitian.

2. Desain dalam Evaluasi Formatif

Menggunakan desain formatif dalam program berarti karyawan program akan berkesempatan melihat dengan saksama keefektifan program dan komponen yang ada di dalamnya. Hal ini memungkinkan evaluator menjalankan fungsinya yang utama, menganjurkan orang-orang program mengamati terus-menerus dengan cermat kegiatan-kegiatan dalam program.

3. Beberapa saran untuk Evaluasi Formatif

a Mengambil beberapa versi dan berbagai macam program yang akan dinilai.

b Mengurangi beberapa persyaratan untuk kepentingan penerapan desain.

c Melakukan eksperimen kecil atau pilot test (tes pilot).

4. Elemen-Elemen dalam Desain

a. Kelompok Eksperimen

b. Kelompok Kontrol

c. Kelompok Kontrol Ekuivalen

d. Kelompok Kontrol non-Ekuivalen

e. Postes

f. Pre-test

- Informasi apa yang harus dikumpulkan?

Dalam melakukan evaluasi, informasi yang harus dilakukan adalah informasi yang harus dicari untuk menjawab pertanyaan-pertanyaan evaluasi. Informasi yang tidak memadai, yaitu informasi yang tak dapat dipercaya atau tidak relevan dengan pertanyaan-pertanyaan yang ditanyakan evaluasi. Informasi yang memadai atau yang baik yaitu informasi yang datang dari atau yang berasal dari sumber yang dapat dipercaya untuk menjawab pertanyaan evaluasi.

Informasi paling tidak harus menjawab pertanyaan tentang evaluasi, dan harus mencapai criteria-kriteria sebagai berikut.

Terpercaya, informasi yang dapat dipercaya oleh klien, yaitu informasi yang akurat, diberikan oleh orang atau sumber yang juga terpercaya dan benar.

Praktis, informasi yang praktis yaitu informasi yang diperoleh dengan wajar, tidak mahal dan tidak sulit.

Prioritas dihubungkan dengan dana dan waktu. Informasi harus diserahkan tepat pada waktunya, apabila terlambat tentu tak akan berguna lagi bagi pemegang keputusan.

Akurasi, informasi yang akurat, yaitu informasi yang relevan dan terpercaya dan tak banyak kesalahan, terutama tentang metode dan proses pengumpulan dana dan analisisnya.

Kemudahan menganalisis

Objektivitas, informasi yang objektif yaitu informasi yang langsung dan yang belum dinodai oleh klien atau orang lain yang mempunyai minat.

Kejelasan, informasi yang jelas yaitu informasi yang mudah dan dapat dimengerti dan tidak ambigis atau yang yang dapat memberi penafsiran ganda.

Pembatasan ruang lingkup, yang diberikan hendaknya cukup luas untuk menjawab pertanyaan evaluasi, tapi jangan terlalu luas sehingga sulit dikelola.

Keberadaan, data yang mudah atau diperoleh dan sudah ada ini yang diprioritaskan.

Manfaat, informasi yang berguna atau bermanfaat, yaitu inforamsi yang tepat waktu dan relevan terhadap pertanyaan klien.

- Berapa banyak informasi harus dikumpulkan

Sampling ialah memilih satu porsi dari seluruh kelompok, untuk mewakili seluruh kelompok tersebut. Porsi ini dikenal dengan nama sampel, seluruh kelompok disebut populasi. Bila mengukur sampel, maksudnya akan mempelajari populasi tanpa megukur seluruh populasi.

1. Beberapa Metode Sampling

a. Random

1. Straight random sampling

Memilih sample dengan metode acak, popoulasi ditentukan sebelumnya. Proporsi sample menetukan tingkat ketepatan populasi yang diwakilinya.

2. Quota sampling

Sampel diambil dari populasi dengan criteria tertentu dan dibuat sebagai ukuran kategori tersebut. Misalnya, sampel orang tua murid, dapat diambil secara acak dari daftar yang telah ditentukan sebelumnya dari siswa yang orang tuanya berpendapatan tinggi, sedang, rendah, yang orang tuanya orang Batak, orang Bali,dsb.

3. Stratified sample

Stratified sample bermanfaat apabila anda berminat pada salah satu strata yang lebih banyak dari strata yang lainnya.

4. Matrix sample

Metode ini mengambil sampel baik dari populasi tertentu, maupun misalnya dari butir-butir tes suatu instrument tertentu.

b. Purposive

1. Key informants

Metode sample individual ini dipakai untuk mengumpulkan informasi tentang kondisi dan situasi tertentu.

2. Expert judqes

Metode ini melibatkan sampling orang-orang yang mempunyai keahlian tertentu, tentang kondisi atau ilmu penegetahuan tertebtu yang diminati.

3. Extreme group

Metode ini mencari sudut pandangan yang konfluik atau ekstrem, sedang metode random bertujuan menghindari bias dan mencari rata-rata atau cirri-ciri khusus.

4. Grapevine sampling

Metode ini memerlukan sample yang berkembang atau tumbuh, di mana setiap sampel ditentukan oleh sampel sebelumnya (anggota sampel yang terdahulu).

- Bagaimana memilih dan menegmbangkan Instrumen?

Instrumen ialah alat untuk merekam informasi yang akan dikumpulkan. Beberapa instrumen yang biasa dipakai dalam prosedur pengumpulan informasi, yaitu:

1. Surveys

2. Interviews

3. Observations

4. Tests

5. Inventories

6. Site visits, expert reviews, panel hearings

- Petunjuk umum tentang pembuatan Instrumen

1. Apa konten yang diperlukan?

2. Apa dan bagaimana bahasa yang akan dipakai?

3. Prosedur analisis apa yang akan dipakai?

4. Apakah ada pertimbangan khusus lainnya?

5. Tentukan seberapa ketepatan yang diperlukan.

6. Kapasitas responden.

7. Kesesuaian dengan rencana analisis.

- Memeriksa instrumen yang telah dibuat

1. Validitasnya

2. Reliabilitasnya

3. Instrument tidak berubah

4. Kesesuaian dengan analisis yang dikehendaki

5. Sesuai dengan analisis yang dikehendaki

6. Ekonomis

- Validitas dan Relibilitas Instrumen

Validitas dan relibilitas merupakan ciri-ciri instrument yang harus ada pada setiap instrument yang akan dipakai untuk mengumpulkan data. Validitas menunjukkan kenbenaran dan keaslian data yang dikumpulkan instrument. Instrument harus mengukur apa yang harus diukur sesuai dengan rencana. Relibilitas menunjukkan ketepatan pengukuran. Tambah banyak kesalahan dalam pengukuran bertambah kecil relibilitas instrument.

- Macam-macam Validitas dan rlibilitas

a. Validitas

1. Content Validity

2. Concurrent Validity

3. Predictive Validity

4. Constant Validity

b. Reliabilitas

1. Stability, repeatability

2. Inter-Judge atau rater agreement

3. Equivalency

4. Internal consistency

- Menganalisis dan Menginterpretasi Informasi

Analisis ialah proses untuk mengetahui informasi yang telah dikumpulkan. Analisis termasuk mengolah data yang telah dikumpulkan untuk menentukan kesimpulan yang didukung data tersebut, seberapa banyak ia mendukung dan tidak mendukung kesimpulan. Tujuan analisis ialah membuat singkatan dari data dan menyimpulkan pesan-pesan yang ada di dalamnya sebagai informasi yang dapat dipakai sebagai dasar yang tentative untuk keputusan.


- Bagaimana Mengolah Data?

Data harus diolah dengan tepat, disimpan, disiapkan, dan dianalisis. Hal ini termasuk member kode kepada data, menyatakan dan mengaturnya kemudian menyimpan di tempat yang aman. Mengatur sedemikian rupa sehingga dapat mudah digunakan, jangan hilang atau terlupakan.

- Petunjuk tentang Memberi kode dan Mengatur data

1. Jangan terlalu bnayak menggunakan kode.

2. Buatlah kode sesederhana mungkin.

3. Pilihlah variable koding berhati-hati.

4. Latihlah asisten anda.

5. Desain untuk koding.

6. Simpanlah rekama data (record).

7. Tetap menjaga etika.

- Masalah-masalah yang dihadapi dalam Menilai data

1. Jawaban yang tidak lengkap atau gangguan dalam proses pengumpulan.

2. Salah koding atau koding yang tidak konsisten.

3. Responden bukan sampel yang representative bagi populasi

4. Hanya sedikit instrument yang kembali, atau hanya sedikit item yang dijawab.

5. Data yang diterima bukan dari sampel yang representative.

6. Administrasi dan prosedur monitor berjalan tidak sesuai rencana.

7. Respon atau jawaban yang aneh atau luar biasa dan tidak wajar.

8. Jawaban yang berbeda untuk item yang sama, ataumalah saling berlawanan.

9. Sejumlah responden tidak memberi jawaban yang bersikap individu seperti yang diharapkan.

10. Responden tidak merating atau mengobservasi item secara konsisten.

- Petunjuk umum untuk Menilai data

1. Bertambah kompleks dan sulit instrument dan kode, bertambah besar kemungkinan terjadi kesalahan.

2. Bertambah banyak data yang terkumpul, bertambah banyak yang tidak diinginkan ( tidak lengkap, tidak konsisten, belum selesai, dsb).

3. Apabila ketepatan yang diinginkan tinggi, maka ketelitian memilih, menyortir, dan membersihkan juga harus tinggi.

4. Bila prosedur analisis luas dan mahal, maka waktu lebih banyak dipergunakan untuk melihat dan me,meriksa apakah data bermutu untuk dianalisis (perlu dianalisis atau tidak).

5. Gunakan cara-cara penilaian data (verifikasi).

- Petunjuk dan Prosedur untuk Analisis

1. Periksalah pertanyaan-pertanyaan yang akan dijawab

2. Siapkan analisis yang deskriptif

3. Catatlah isu-isu penting tentang trends (kecenderungan), hubungan dan pertanyaan-pertanyaan.

4. Periksalah bukti-bukti (evidence) yang ada.

- Analisis Data

1. Metode-metode yang dipakai untuk menganalisis data kualitatif

Langkah merumuskan data kualitatif

a. Yakinlah bahwa semua telah tersedia.

b. Buatlah kopi atau salinan untuk berjaga-jaga kalau sampai hilang.

c. Aturlah data dalam judul dan masukkan dalam file.

d. Periksa kebenaran hasil evaluasi dengan:

- Mempelajari keterangan yang berlawanan;

- Lihat kembali kasus-kasus yang negative dan perkecualian-perkecualian;

- Triangulasi, menjajarkan data-data yang kualitatif dengan data-data yang kuantitatif dan membandingkannya

- Mutu

2. Mean, Median, dan Modus

Mean diperoleh dengan dengan menjumlahkan semua skor dan membagi jumlah itu dengan banyaknya skor total. Median adalah nilai tengah dari kumpulan skor. Modus ialah nilai yang sering muncul pada sekelompok skor.

3. Range dan Standar Deviasi

Range dan standar deviasi merupakan dua cara untuk menerangkan penyebaran sekelompok skor. Range ialah selisih antara skor tertinggi dan terendah. Standar deviasi ialah akar kuadrat dari rata-rata kuadrat simpangan terhadap mean skor kelompok itu.

4. Tingkat persentil dan skor Standar (Percentil Rank and Standard Scores)

Tingkat persentil dan skor standar adalah dua cara untuk menjelaskan bagaimana skor individu dibandingkan dengan skor lainnya dalam kelompok. Rank ialah persentasi kasus ( cases) yang jatuh di bawah skor individu. Skor standar dinyatakan dengan satuan standar deviasi di atas atau di bawah mean kelompok.

- Melaporkan Hasil Evaluasi

Tujuan laporan evaluasi berhubungan langsung dengan tujuan pemakaiannya. Pada evaluasi formatif tujuan utamanya yaitu untuk memperbaiki dan mengembangkan program, dan laporannya harus diserahkan secepatnya kepada orang program (karyawan), diinformasikan pula tentang bagaimana program berfungsi dan perubahan-perubahan apa yang harus dilakukan untuk tujuan tersebut.

Sembilan manfaat laporan evaluasi, yaitu :

1. Pertangggung jawaban

2. Menjelaskan, meyakinkan

3. Mendidik

4. Meneliti

5. Dokumen

6. Turut terlibat

7. Mendapat dukungan

8. Menambah pengertian

9. Hubungan masyarakat

- Bentuk-bentuk Laporan evaluasi

Pertanyaan-pertanyaan berikut ini akan menolong cara pemilhan laporan yang anda pilih

1. Sampai sejauh mana dan dalam bentuk masalah-masalah yang dihadapi pemakai.

2. Sampai sejauh mana informasi praktis sejalan dengan perspektif pemakai?

3. Sampai sejauh mana informasi berguna dan segera dapat dipakai dalam situasi pemakai?

4. Informasi apa yang dianggap pemakai dapat dipercaya (credible) dan apa yang mendukung kredibilitas tersebut?

5. Sampai sejauh mana informasi dapat dimengerti oleh pemakai primer?

Banyak cara untuk menyampaikan penemuan dengan media komunikasi berikut :

1. Bentuk komunikasi yang mungkin digunakan (Anderson & Ball, 1980), yaitu :

a. Technical report

b. Excecutive summary

c. Technical professional paper

d. Popular article

e. New releases, pers conference

f. Media appearance

g. Staff workshop

h. Brochure, posters

i. Memo

j. Personal decussion

2. Pemakai

a. Finding agency

b. Program administrator

c. Board members, trustees, other management staff

d. Advisory committee

e. Political bodies (city councils, legislators)

f. Community groups

g. Current client

h. Potential clients

- Evaluasi Meta

Evaluasi meta dapat dilakukan bersama kegiatan evaluasi yang biasa atau rutin untuk perbaikan sehingga evaluasi akan bertambah baik. Evaluasi meta dilakukan berdasarkan pengetahuan bahwa evaluasi merupakan pelajaran pengalaman bagi mereka yang terlibat, sehingga evaluasi dapat dikembangkan selagi dalam proses dan evaluasi berikutnya dapat lebih berhasil. Evaluasi meta dapat digunakan untuk berbagai macam keperluan.

Prosedur evaluasi meta internal tidak terlalu formal dapat dipakai untuk merevisi suatu evaluasi dan juga dapat menolong anda untuk terus dapat mengikuti kegiatan proses evaluasi (keep track). Evaluasi meta dapat dilakukan kapan saja, mulai dari ketika evaluasi dalam tahap perencanaan, ketika evaluasi dalam proses, dan bahkan pada saat evaluasi sudah selesai dilakukan.

- Siapa yang melakukan evaluasi meta?

Tuntutan untuk seorang evaluator tinggi, tetapi tuntutan terhadap seorang evaluator meta lebih tinggi lagi. Seorang evaluator bukan saja harus kompeten dalam melakukan evaluasi yang pokok, ia juga harus dapat mengetahui bahwa evaluasi itu jelek atau baik dan meyakinkan kepada orang lain akan hasil evaluasinya.


- Standar yang dipakai untuk evaluasi meta

1. Utility Standard

a. Audience Identification

b. Evaluator Credibility

c. Information Scope and Selection

d. Valuational Interpretation

e. Report Clarity

f. Report Dissemination

g. Report Timeliness

h. Evaluation Impact

2. Feasibility Standard

a. Practical Procedur

b. Poltical Viability

c. Cost Effectiveness

3. Property Standard

a. Formal Obligation

b. Conflict of Interest

c. Full and Frank Disclosure

d. Public’s Right to Know

e. Rights of Human Subjects

f. Human Interaction

g. Balanced Reporting

h. Fiscal Responsbility

4. Accuracy Standard

a. Object Identification

b. Contect Analysis

c. Described Purpose and Procedure

d. Defensible Information sources

e. Valid Measurement

f. Reliable Measurement

g. Systematic Data Control

h. Analysis of Quantitative Information

i. Analysis of Qualitative Information

j. Justified Conlutions

k. Objective Reporting

- Langkah-langkah untuk melakukan evaluasi meta

1. Siapkan satu salinan desain yang siap untuk direview.

2. Tentukan siapa yang akan melakukan evaluasi meta.

3. Pastikan bahwa ada hak untuk melakukan evaluasi meta.

4. Gunakan standar atau kriteria meta evaluasi untuk melakukan evaluasi meta.

5. Gunakan kriteria atau standar evaluasi pada desain anda.

- Instrumen Evaluasi

Teknik observasi terutama berguna untuk mengevaluasi performance skills dan aspek-aspek personal social development. Sebagai tambahan, hasil observasi merupakan pelengkap paper and pencil testing dengan melihat bagaimana pelajar berperilaku dalam situasi yang alami. Teknik observasi yang kurang berstruktur adalah AR. AR ini hanyalah metode deskripsi tentang perilaku pelajar. Untuk menjaga agar AR tetap feasible, perlu dijaga agar observasi dibatasi dengan jangka waktu dan perilaku yang terbatas, tertentu sesuai dengan tujuan. Manfaat AR adalah : 1) Menjelaskan perilaku dalam setting yang alami; 2) Menggarisbawahi perilaku yang mungkin terlewat oleh teknik-teknik perilaku yang lain; 3) Dapat dipakai untuk mengevaluasi anak-anak muda usia dan juga yang cacat (retarded). Keterbatasan AR adalah : 1) Waktu dan usaha yang diperlukan untuk mempertahankan system record yang tepat; 2) Kesulitan untuk menulis deskripsi yang objektif, dan 3) Agak sulit untuk memperoleh sample perilaku yang tepat. Keterbatasan tersebut dapat diminimalisir atau diperkecil dengan mengikuti prosedur yang spesifik atau khusus untuk onservasi dan merekam perilaku (behavioral incident).

Saran-saran untuk memajukan AR termasuk ; 1) Tentukan dulu apa yang akan diamati atau diobservasi; 2) Jelaskan situasi (setting), dimana perilaku itu terjadi ; 3) rekam kejadian secepatnya setelah terjadi; 4) Batasi setiap anekdot menjadi suatu insiden yang negative, dan yang positif; 7) Kumpulkan sejumlah anekdot sebelum menarik kesimpulan, dan 8) Lakukan training sebelum observasi yang sebenarnya.

Rating scale (RS), ialah prosedur yang sistimatis untuk memperoleh dan merekam hasil observasi. Dari beberapa macam RS, skala deskriptif grafik tampaknya yang paling baik digunakan di sekolah. Dalam prosedur rating, dan produk rating, dan bermacam-macam aspek personal social development beberapa kesalahan biasa terjadi. Hal ini termasuk 1) personal bias, 2) halo effect, dan 3) logical error. Kontrol error semacam itu dapat dilakukan dengan pemakaian yang hati-hati RS. RS yang efektif ialah: 1) Pilih karakteristik penting yang bersifat mendidik; 2) Batasi rating pada objek yang akan diamati; 3) Rumuskan dengan jelas cirri-ciri yang akan diamati; 4) Batasi jumlah poin pada skala; 5) Izinkan rater melewati (omit) bila mereka kurang bisa menilai atau tidak mengerti,dan 6) Kombinasi rating dari beberapa orang rater bila mungkin.

Checklists (CL), mempunyai9 fungsi kurang lebih sama dengan RS. Dipakai untuk menilai prosedur, dan aspek-aspek personal social development bila evaluasi pada cirri-ciri yang terbatas, yang sederhana, mencek ada atau tidak (ya - atau – tidak).

Partisipasi pelajar dalam membuat atau mengembangkan alat evaluasi atau observasi punya manfaat penting untuk cara belajarnya, dan keterampilan self evaluation.

- Instrumen Evaluasi Tes Essay Objektif Dan Lisan

Tes Essay

Tes essay yaitu tes yang jawabannya berupa uraian kalimat yang relative panjang atau berupa karangan. Ada dua macam tes essay, yaitu:

a. Extended response

b. Restricted respons

1. Kelebihan tes essay

- Sangat baik untuk mengukur atau menilai kemampuan menulis dan kreativitas dalam menuangkan pendapat dalam bentuk tulisan.

- Relative mudah dan cepat membuatnya.

- Dapat membuat siswa belajar lebih giat dan sungguh-sungguh.

2. Keterbatasan tes essay

- Hanya dapat memberikan sampel yang terbatas.

- Sulit untuk dinilai.

- Realibilitasnya rendah baik bagi guru maupun bagi siswa.

Tes Objektif

Tes objektif (obyektif test) dibagi dua macam, yaitu :

a. Supply type

Supply type : Short answer

1. Question type

2. Completion type

3. Association type

· Kelebihan Short answer:

1. Sangat baik untuk pengukuran dalam matematika.

2. Baik juga untuk bahasa asing.

3. Untuk mengetes definisi dan terms dalam teknik sangat baik.

4. Mudah dilaksanakan.

· Keterbatasan Short answer:

1. Hanya terbatas atau tidak yak pertanyaan atau masalah yang dapat dijawab hanya dengan satu kata, symbol atau angka.

2. Hampir tidak mungkin membuat butir SA yang mengukur sintesis, analisis, atau interpretasi.

3. Cenderung hanya mengukur hafalan.

4. Kemungkinan jawaban yang banyak, kurang reliable.

· Saran-saran untuk menulis Short answer:

1. Untuk soal hitungan guru hendaknya lebih spesifik terutama untuk jawaban.

2. Hilangkan kata-kata yang penting (fill in blank).

3. Jangan terlalu banyak kata-kata yang dihilangkan.

4. Secara umum lebih baik yang berbentuk direct question daripada incomplete statement.

5.

b. Select type

Select type :

1. True false

· Kelebihan true false

a. Baik untuk anak-anak dan mereka yang kurang dalam membaca

b. Dapat meng-cover (melingkupi) bidang yang luas dalam waktu yang relative singkat.

c. Relabilitasnya tinggi.

d. Dapat skor dengan mudah dan cepat.

e. Dapat membantu pemecahan kesulitan dalam pembuatan MC.

· Keterbatasan true false

a. Mungkin benar karena tebakan.

b. Otomatis orang akan memilih yang benar tanpa benyak piker.

c. Cheating lebih murah.

2. Matching

· Kelebihan Matching Exercise

Matching baik atau cocok untuk situasi dimana matching ini untuk mengetes. Terms, definisi, event dan hal lain yang memerlukan hubungan-hubungan yang sederhana. Misalnya tanggal kejadian, penulis dengan judul buku yang ditulisnya, penemuan dsb., seperti pertanyaan Wh: What, Who, When, Where, How, dll.

· Manfaat yang Umum

1. Banyak yang dapat ditanyakan dalam waktu yang relative singkat.

2. Dapat diperisa dengan mesin.

· Keterbatasan Matching Exercise

1. Bila tidak dibuat teliti, dapat berupa serial memorization.

2. Agak sulit mengelompokkan pertanyaan yang homogen.

3. Multiple choice

Multiple Choice terdiri dari 2 bagian :

a. Stem, yaitu masalahnya.

b. Responses atau option yaitu daftar pertanyaan.

· Kelebihan multiple choice

1. Dapat mengukur baik recall maupun highly mental process.

2. Dapat diskor dengan cepat, baik oleh guru, mesin, operator atau oleh siswa sendiri.

3. Ekonomis dan efisien.

4. Tingkat kesulitan dapat diukur.

5. Tepat untuk diagnostic tes.

· Keterbatasan multiple choice

1. Sulit dibuat.

2. Guru cenderung membuat pertanyaan recall.

3. Sering terjadi tulisan ambigis.

· Kelebihan-kelebihan tes objektif

1. Ekonomis.

2. Content sampling luas.

3. Reliabilitasnya dan validitasnya tinggi.

4. Skorsing mudah.

5. Dapat member insentif, pengetahuan luas, skills, dan ability.

· Keterbatasan tes objektif

1. Tidak mengukur higher mental process.

2. Memberi peluang untuk menebak.

3. Cenderung hanya mengukur daya ingat saja (recall).

4. Mengabaikan pengukuran kemampuan menulis (writing abilty)

Tes Lisan

Pendekatan lisan sering digunakan oleh guru kelas untuk mengevaluasi siswanya. Setiap hari guru bertanya atau memberi pertanyaan kepada siswanya. Pertanyaan oral/ lisan sebenarnya merupakan variasi dari tes essai. Tes lisan in sangat popular di Amerika maupun Negara-negara lain termasuk Indonesia. Tes lisan ini lebih sering dipakai pada ujian akhir untuk mahasiswa ( sarjana atau pasca sarjana) daripada siswa sekolah dasar atau tingkat menengah.

· Keterbatasan

1. Konten terbatas

2. Tingkat reliabilitas rendah

· Kelebihan

1. Tes lisan memberi kesempatan kepada guru dan siswa untuk menentukan sampai seberapa baik seorang guru atau siswa dapat mengatur dan menyimpulkan dan mengekspresikan dirinya.

2. Siswa tidak terlalu tergantung seperti dalam pilihan ganda pada kemampuan siswa untuk memilih jawaban yang benar, tetapi siswa diminta untuk member jawaban yang betul.

3. Siswa dapat memberi respon dengan bebas.