BAB 3
JENIS-JENIS ASESMEN

PENDAHULUAN
Asesmen merupakan kegiatan harian guru, yang ia laksanakan setiap hari, hari demi hari selama proses pembelajaran berlangsung. Tidak ada bentuk tanggungjawab guru lainnya yang lebih penting dibandingkan dengan melakukan asesmen pada murid-muridnya. Guru harus dapat mengkomunikasikan performa akademik dan performa sosial siswa serta kemajuan atau pertumbuhannya kepada berbagai pihak yang terkait meliputi siswa, orang tua siswa, sekolah dan administrator pendidikan, serta masyarakat umum.
Asesmen dan keputusan-keputusan evaluatif yang dihasilkannya haruslah akurat sehingga mampu mencegah pemahaman dan komunikasi yang keliru oleh pihak-pihak terkait. Oleh karenanya diperlukan berbagai jenis asesmen yang secara bersama-sama akan menghasilkan informasi evaluatif yang lengkap dan akurat.
Metode asesmen formal direncanakan lebih bagus dalam pengadministrasiannya. Metode ini kurang spontanitasnya dan biasanya dilaksanakan pada akhir proses pembelajaran. Para siswa menyadari atau mengetahui tentang penggunaan metode asesmen formal ini. Contoh metode ini diantaranya adalah tes meliputi beberapa bab, ujian final, PR terstruktur dan sebagainya. Metode asesmen informal dilaksanakan lebih spontan dan kurang kentara/terlihat. Biasanya terjadi selama proses pembelajaran . Contoh metode ini seperti: observasi dan pertanyaan-pertanyaan yang dilakukan oleh guru selama proses pembelajaran .
Metode asesmen kuantitatif menghasilkan skor berupa angka atau numeris. Secara umum bentuknya meliputi tes yang disusun oleh guru, tes standar, cek lis, dan skala rating. Metode asesmen kualitatif menghasilkan deskripsi secara verbal tentang karakteristik tertentu. Biasanya berbentuk observasi oleh guru, rekaman anecdotal, pertanyaan-pertanyaan informal.
Evaluasi formatif berkaitan dengan pembuatan keputusan yang terjadi selama proses pembelajaran yang bertujuan untuk menyelaraskan proses pembelajaran. Metode ini lebih banyak mengevaluasi pengajaran ketimbang mengevaluasi kerja siswa. Sangat mungkin didasarkan pada metode formal maupun informal. Evaluasi sumatif dilaksanakan pada akhir proses pembelajaran . Contohnya seperti tes pada akhir bab, tes pada akhir satu unit pelajaran, tes akhir semester dan sebagainya. Evaluasi sumatif merupakan bentuk yang sering digunakan untuk keperluan mengambil keputusan secara administrativ( misalnya kenaikan kelas). Evaluasi sumatif semata-mata hanya didasarkan pada metode asesmen formatif.
Metode asesmen baku diadministrasikan, diskor, dan diinterpretasikan dalam model yang identik untuk semua ujian. Asesmen baku bertujuan untuk memberi peluang pada pendidik untuk membandingkan siswa dari sekolah yang berbeda, negara yang berbeda dan seterusnya. Contoh asesmen baku adalah UAN, UNAS, SPMB dan sebagainya.
Metode asesmen tak baku biasanya dalam bentuk buatan guru untuk digunakan di kelas. Asesmen tak baku memiliki tujuan untuk menentukan luasan subyek materi yang sedang diajarkan dan dipelajari.
Metode asesmen rujukan norma menunjukkan dimana letak atau posisi performa seorang siswa dalam kaitannya dengan siswa-siswa lainnya. Asesmen baku atau tes baku biasanya adalah asesmen rujukan norma. Metode asesmen rujukan norma menghasilkan informasi kuantitatif. Dalam metode ini performa siswa dibandingkan dengan kelompok normal (norm group). Metode asesmen rujukan kriteria membandingkan performa siswa dengan criteria atau objektif yang telah ditetapkan. Metode ini menghasilkan informasi kuantitatif, kualitatif atau keduanya. Metode asesmen rujukan kriteria biasanya juga dikenal dengan ketuntasan (mastery), atau objectives-referenced, atau ujian kompetensi (competency tests).
Metode asesmen tes merupakan prosedur pencil-and-paper tests dan kuis. Dalam metode ini hanya ada satu respon/jawaban yang benar untuk setiap butir pertanyaan/pernyataan. Metode ini dinilai merupakan metode yang mudah dan efisien untuk menilai/meng-ases banyak siswa secara simultan. Lebih mengarahkan/menganjurkan pada memorisasi fakta-fakta.
Metode asesmen alternatif merupakan metode asesmen yang lebih cocok untuk proses pembelajaran yang “melakukan” (hands-on), pembelajaran eksperiental (pengalaman belajar). Metode ini meliputi asesmen autentik (mencakup aplikasi riel dari ketrampilan, yang melampaui konteks pembelajaran).
Pada metode asesmen obyektif, kata “obyektif” disini lebih merujuk pada metode penskoran. Pada metode ini hanya mengandung satu jawaban/respon yang benar untuk setiap butir pertanyaan/pernyataan. Contohnya adalah: pilihan ganda, benar-salah, mencocokkan dan sebagainya. Metode ini juga dikenal sebagai structured-response, atau selected-response, atau teacher-supplied items. Metode asesmen subyektif adalah metode asesmen yang teknik penskorannya melibatkan keputusan subyektif guru. Ada beberapa jawaban/respon yang benar atau satu jawaban/respon yang benar dapat dicapai dengan berbagai cara. Contohnya adalah: butir jawab singkat dan butir essay. Asesmen subyektif juga dikenal sebagai open-ended, constructed-response, supply-type items.

3.1 ASESMEN FORMAL DAN INFORMAL
Biasanya asesmen informal meliputi bentuk-bentuk seperti observasi oleh guru, pertanyaan guru selama proses pembelajaran, dan refleksi siswa. Kebanyakan asesmen yang digunakan di kelas adalah asesmen informal. Asesmen ini terjadi selama proses pembelajaran berlangsung, dan dilakukan secara berkelanjutan.
a. Observasi oleh guru
Observasi oleh guru merupakan kegiatan memperhatikan/melihat dan/atau mendengarkan siswa seperti: bagaimana ia melakukan kegiatan belajar, atau bagaimana ia membuat hasil produk belajar dan sebagainya. Observasi oleh guru bertujuan untuk merekam dan mendeskribsikan perilaku siswa seperti apa adanya. Dapat memberikan informasi yang mengarah pada: 1) kualitas performa siswa, 2) proses dan prosedur siswa dalam melengkapi atau mengerjakan tugas belajarnya, 3) proses dan prosedur yang guru gunakan dalam melaksanakan pembelajaran.
Karakteristiknya antara lain: 1) banyak kejadian yang diobservasi secara bersamaan atau berhasil dalam waktu yang cepat, 2) observasi kelas tentu saja focus pada satu kejadian, 3) guru harus bergantung pada observasi siswa, 4) sangat banyak kejadian yang ada di kelas yang terlewatkan tidak dicatat, 5) observasi cepat dilupakan atau terkontaminasi tatkala dipanggil ulang, 6) observasi tentu saja perlu inferensi
Petunjuk penggunaannya: 1) ketahuilah apa yang akan diobservasi, 2)ketahuilah keterbatasan tempat dan berapa banyak yang sedang diobservasi, 3) akrablah dengan apa yang diobservasi, 4) hindari perluasan inferensi, perhatikan kejadian yang substansial, 5) sadari bahwa observasi bisa menjadi overestimate achievement, 6)observasi dokumen yang harus dipanggil ulang di waktu kemudian
Penyimpanan Rekaman:
a) Rekaman anekdotal: narasi pendek yang mendeskribsikan konteks dan perilaku, digunakan untuk dokumen perilaku sebagai referensi di waktu kemudian oleh guru atau yang lainnya, boleh jadi meliputi interpretasi, bias harus dihindari dalam beberapa interpretasi, hanya rekaman observasi yang sangat penting dan tidak dapat ditemui melalui metode asesmen kelas yang lebih formal
b) Checklist: daftar perilaku atau outcomes, yang guru mengindikasikannya dengan mudah untuk diobservasi, dibatasi untuk situasi yang menghadirkan atau tak menghadirkan suatu kondisi untuk ditentukan, lebih terstruktur ketimbang rekaman anecdotal. Hanya ada dua pilihan yang mungkin untuk observasi yaitu: diobservasi atau tidak diobservasi
c) Rating scales: merupakan penyederhanaan dari checklists; balikan yang jauh lebih spesifik(sepanjang sebuah kontinum). Dapat mengidikasikan frekuensi atau derajad tentang bagaimana siswa mempertunjukkan sebuah karakteristik. Dapat digunakan secara formatif maupun sumatif. Biasanya juga dirujuk sebagai rubrics (holistic dan analytic)
b. Pertanyaan guru
Pertanyaan guru: informal, tak terencana (unplanned), oral spontan secara ikuiri yang diajukan oleh guru kepada siswa, berguna sebagai sebuah monitoring terhadap pemahaman siswa sepanjang proses pembelajaran. Dapat diajukan lower-questions dan higher-questions, juga dapat digunakan sebagai satu bentuk refleksi diri (self-reflection) dari siswa.
Karakteristik pertanyaan guru antara lain: 1) dapat menjadi menonjolkan diri, 2)harus diinterpretasikan oleh guru lain, harus menjadi jelas, 3) dapat diarahkan pada individu-individu, pada kelompok-kelompok kecil, atau pada seluruh kelas, 4)pertanyaan-pertanyaan detil ditanyakan dan bagian responnya dengan cepat dilupakan.
Petunjuk penggunaan: 1) kembangkan pertanyaan dari objectiv pembelajaran, 2) berikan sebuah masalah yang jelas untuk siswa , 3) berikan waktu yang cukup bagi siswa untuk merespon, 4) hindari kebingungan siswa, 5) tujukkan perhatian ketika menanggapi respon siswa
Rekaman penyimpanan; masih sedikit teknik yang ada untuk keperluan ini, guru dapat menyesuaikan bentuk variasi checklist untuk mendokumentasikan partisipasi dan respon siswa.
c. Refleksi siswa
Refleksi siswa merupakan narasi ikhtisar atau laporan diri yang ditulis oleh siswa tentang subyek materi yang dipelajarinya. brief narratives or self-reports written by siswa concerning the subject matter being studied.dapat berupa jurnal belajar atau buku catatan belajar. dilengkapi secara periodic oleh siswa unit demi unit. Dapat juga berupa ringkasan materi, pertanyaan-pertanyaan yang diajukan sepanjang atau selama kelas berlangsung, karakteristik dari sebuah proyek dan sebagainya.
Memberi kesempatan kepada guru dan siswa untuk mendiskusikan komentar-komentar dan pertanyaan-pertanyaan. Yang digunakan secara luas dengan berbagai variasi adalah bentuk one-minute paper.
Para siswa diberikan kesempatan beberapa menit dari acara di kelas untuk merespon (dalam bentuk tulisan dan tanpa nama) satu atau dua pertanyaan yang diberikan secara spesifik oleh guru.
1. Hal terpenting apakah yang kamu pelajari di kelas sepanjang hari ini?
2. Pertanyaan apakah yang dapat kamu ajukan setelah kamu mengikuti pembelajaran di kelas hari ini?
3. Saya akan mencari tahu lebih jauh tentang ………
4. Saya masih tidak percaya tentang …
Respon siswa dikumpulkan dan disintesis oleh guru. Guru memulai kelas berikutnya dengan komentar hasil sintesis yang telah dilakukannya. Guru menekankan pada tanggungjawab siswa untuk didengar dan diproses.
d. Validitas and Reliabilitas Asesmen informal
Tentu saja perlu bersabar untuk mereduksi validitas dan Reliabilitas yang diakibatkan oleh subyektivitas alamiah. Validitas dan Reliabilitas asesmen informal dapat ditingkatkan dengan cara mencegah munculnya masalah-masalah yang umum.
Validitas, dapat dipengaruhi oleh pengambilan keputusan atau pengantisipasian perilaku siswa secara merugikan. Ketidakcocokan indicator-indikator dari karakteristik siswa terkadang dapat dipilih.
Reliabilitas, dipengaruhi oleh kurang-mencukupinya pengambilan sample perilaku siswa. Gambaran inferensi dalam satu setting mungkin tidak diperluas pada setting yang lainnya.
e. Keuntungan dan Keterbatasan Asesmen informal
Keuntungannya, adalah efisien dan dapat diadabtasikan, dapat dibangun ke dalam arus pelajaran (bukan interupsi), dan dapat digunakan untuk memonitor kegiatan belajar dan pembelajaran.
Keterbatasannya, adalah observasi dibatasi hanya untuk perilaku yang terjadi secara alamiah. Guru mengamati hanya bagian-bagian dari perilaku siswa. beberapa observasi informal berlangsung tetapi tidak didokumentasikan dan oleh karenanya mudah dilupakan
3.2 ASESMEN BERBASIS PERFORMA
Asesmen berbasis performa (juga dikenal sebagai asesmen performa) mempersyaratkan siswa untuk menerapkan pengetahuan dan ketrampilannya. Asesmen performa dapat digunakan secara formatif atau secara sumatif. Asesmen ini dapat menjadi labor- and time-intensive, dan juga cenderung menjadi berbeda sama sekali.
a. Karakteristik Asesmen berbasis performa
Asesmen performa menghadirkan siswa dengan hands-on tasks. Atau asesmen berbasis performa lainnya yang mengharuskan siswa melengkapi secara individual atau dalam kelompok kecil; pekerjaan siswa dievaluasi menggunakan criteria yang telah dibangun sebelumnya.
Asesmen performa terdiri dari dua komponen yaitu: 1) sebuah performance task (aktivitas atau actual prompt) dan 2) sebuah rubrik penskoran (scoring rubric) atau panduan penskoran yang terdiri dari kriteria performa yang telah ditetapkan/dibangun sebelumnya.
Asesmen performa mengijinkan observasi langsung terhadap kemampuan dan ketrampilan siswa (sangat berbeda dengan pencil-and-paper tests). Asesmen performa harus dikaitkan dengan objectiv pembelajaran. Disamping itu asesmen performa cenderung lebih abstrak ketimbang bentuk-bentuk asesmen tradisional, artinya asesmen performa lebih “real world”. Asesmen performa yang didasarkan pada “real world” dikenal dengan authentic assessment.
Asesmen performa, karena dilakukan oleh siswa sendiri, merupakan aktivitas pembelajaran yang penuhmakna. Konsep asesmen performa bukan merupakan konsep baru; digunakan untuk bertahun-tahun di bidang yang lain
Beberapa persyaratan dasar dari asesmen performa:
a. kemampuan dan perilaku spesifik (krusial) harus diobservasi
b. sangat cocok untuk mengukur ketrampilan dan kemampuan siswa yang kompleks yang tak dapat diukur dengan menggunakan pencil-and-paper tests
c. tugas-tugas harus focus pada proses-proses yang dapat diajarkan oleh guru atau dipelajari oleh siswa
d. dapat dipakai untuk memutuskan kecocokan perilaku atau pemahaman
e. dapat dipakai untuk memutuskan kecocokan perilaku atau pemahaman yang memberikan informasi tentang kekuatan(strengths) dan kelemahan (weaknesses)
f. mempersyaratkan adanya produk perilaku yang bernilai untuk kebaikannya
g. tugas-tugas harus mendorong atau memotivasi refleksi siswa.
b. Asesmen Proses vs Asesmen Produk
Asesmen proses target khususnya adalah prosedur yang digunakan oleh siswa untuk menjawab suatu permasalahan atau problem. Asesmen Produk target utamanya adalah hasil-hasil belajar siswa yang berupa produk yang dapat diukur (results in tangible outcome).
Para guru biasanya lebih tertarik pada salah satunya (asesmen proses atau asesmen produk), walaupun tugas-tugas itu mungkin saja mempersyaratkan keduanya (asesmen proses dan asesmen produk). Keputusan tentang focus dari tugas-tugas itu harus dibuat oleh guru.
c. Pengembangan Tugas-Tugas Asesmen Performa
Ada empat gambaran esensial yang perlu dipertahankan dalam pengembangan tugas-tugas dalam asesmen performa:
1) mempunyai satu tujuan yang jernih yang menspesifikasikan keputusan hasil yang akan dibuat dari asesmen: a) merupakan tahap-tahap yang krusial, b) apakah hasil asesmen akan digunakan untuk tujuan formatif atau sumatif?, c) pada apakah tugas itu akan difokuskan, pada proses, produk atau keduanya?
2) Mengidentifikasi aspek-aspek produk atau performa siswa yang akan diputusi: a)Kriteria produk atau performa siswa yang akan diases harus secara spesifik dapat diamati, b) difokuskan pada proses, produk atau keduanya, c) harus dapat dinyatakan dengan jernih, d) criteria harus dibatasi pada sejumlah hal yang dapat dikelola dan dipikirkan dengan jelas
3) Hasilnya dinyatakan dalam satu atau lebih skor yang mendeskripsikan performa siswa
4) Memberikan sebuah seting yang cocok untuk kegiatan melengkapi tugas-tugas itu.
Pendesainan tugas-tugas Performa: Prosedur tahap demi tahap
Tahap 1: Menentukan tujuan asesmen .
Tahap 2: Menspesifikasikan ketrampilan dan outcomes merujuk pada taxonomic level.
Tahap 3: Menspesifikasikan criteria performa yang akan digunakan untuk men-judge pekerjaan siswa, dan mengidentifikasi indicator-indikator tampak dari criteria itu.
Tahap 4: mengembangkan konteks yang authentic dan meaningful untuk tugas-tugas itu.
Tahap 5: mengembangkan instrumen penskoran (rubrik scoring).
Tahap 6: membangkitkan atau memilih contoh-contoh respon siswa
Tahap 7: merevisi tugas, sesuai dengan keperluan.
d. Metode Penskoran Asesmen berbasis performa
Biasanya, tidak ada jawaban benar atau salah yang sederhana; mereka harus diases beberapa saat semacam kontinum. Fokus pada derajad kualitas, pemahaman, kecakapan dsb. Sasarannya untuk mencoba mereduksi potensi subyektivitas dalam penskoran. Terbuka mengenai instrumen penskoran kepada siswa, memberikan bimbingan kepada siswa dengan merujuk pada hakekat open-ended-nya tugas-tugas performa.
Gambaran metode-metode penskoran asesmen performa ditunjukkan oleh gambar berikut.

Gambar 3.1 Skema Metode Penskoran Asesmen Performa
Checklists, merupakan daftar perilaku atau ketrampilan (skills) siswa, yang mengindikasikan setiap perilaku atau ketrampilan siswa yang telah diobservasi. Sangat baik (paling baik) ketika digunakan secara formativ, untuk memberikan indikasi kekuatan dan kelemahan secara cepat.
Rating scales: memperkenankan guru untuk mengindikasikan frekuensi atau derajad bagaimana ketrampilan atau perilaku dipertunjukkan oleh siswa
Rubrics: merupakan rating scales yang secara khusus digunakan untuk penskoran hasil asesmen performa. Merupakan panduan penskoran yang terdiri dari criteria performa spesifik yang telah ditetapkan/dibangun sebelumnya , digunakan untuk mengevaluasi pekerjaan siswa dalam asesmen performa.

Ada dua tipe rubrik yaitu:
1. Holistic rubric: skore ditentukan untuk seluruh proses atau produk.
a. digunakan ketika kesalahan dalam proses dapat ditoleransi
b. digunakan dengan tugas-tugas dimana tidak ada respon benar yang definitif
c. sangat cepat untuk menskor, tetapi kurang dapat memberikan balikan
Contoh Holistic Rubrics
Skore Deskripsi
5 mendemonstrasikan secara lengkap pemahaman terhadap masalah. semua persyaratan tugas ada dalam respons/produk siswa.
4 mendemonstrasikan sebagian besar pemahaman terhadap masalah. semua persyaratan tugas ada dalam respons/produk siswa.
3 mendemonstrasikan sebagian pemahaman terhadap masalah. sebagian besar persyaratan tugas ada dalam respons/produk siswa.
2 mendemonstrasikan sebagian kecil pemahaman terhadap masalah. beberapa persyaratan tugas ada dalam respons/produk siswa.
1 tidak mendemonstrasikan pemahaman dari masalah.
0 tak ada respon atau tugas-tugas tak dikerjakan.

2. Analytic rubric: rubrik penskoran dimana komponen individual dari produk atau performa siswa diskor secara terpisah.
a. digunakan ketika lebih focus pada tipe respon yang dipersyaratkan.
b. biasanya menghasilkan beberapa skor, yang bisa saja dijumlahkan untuk memperoleh skor total.
c. lebih lambat dalam proses penskoran namun lebih detil dalam memberikan balikan.
Contoh rubrik analitik adalah sebagai berikut:
permulaan pengembangan Tuntas dengan baik sempurna skor
Kriteria 1 Deskripsi mencerminkan level performa pemula Deskripsi mencerminkan kemajuan menuju level performa tuntas Deskripsi mencerminkan prestasi level performa tuntas Deskripsi mencerminkan performa level tingkat tinggi
Kriteria 2 Deskripsi mencerminkan level performa pemula Deskripsi mencerminkan kemajuan menuju level performa tuntas Deskripsi mencerminkan prestasi level performa tuntas Deskripsi mencerminkan performa level tingkat tinggi
Kriteria 3 Deskripsi mencerminkan level performa pemula Deskripsi mencerminkan kemajuan menuju level performa tuntas Deskripsi mencerminkan prestasi level performa tuntas Deskripsi mencerminkan performa level tingkat tinggi
Kriteria 4 Deskripsi mencerminkan level performa pemula Deskripsi mencerminkan kemajuan menuju level performa tuntas Deskripsi mencerminkan prestasi level performa tuntas Deskripsi mencerminkan performa level tingkat tinggi
TOTAL SKOR ———-

Satu tipe rubrik tidak selalu lebih baik dari tipe yang lainnya, sangat bergantung pada tujuan. Biasanya tujuan yang berbeda akan berimplikasi pada pemilihan tipe rubrik yang berbeda. Guru harus memutuskan bagaimana format yang diperlukan dan cocok dengan tugas-tugas yang ada. Boleh jadi rubrik berupa tingkat-tingkat kemahiran dan sebagainya, boleh jadi bersifat kualitatif, kuantitatif ataupun keduanya.
Prosedur mengembangkan Rubrik Penskoran tahap demi tahap:
Tahap 1 : mempertanyaakan ulang objectiv pembelajaran untuk menentukan tugas-tugas yang cocok
Tahap 2 : menentukan atribut-atribut spesifik yang tampak yang ingin kamu lihat (seperti halnya yang tidak ingin kamu lihat)
Tahap 3 : renungkan karakteristik yang mendesripsikan masing-masing atribut
Tahap 4a : (untuk rubrik holistic) tulislah deskripsi naratif secara rinci untuk pekerjaan yang sangat sempurna dan sangat tidak sempurna, mempersatukan/mempertautkan tiap atribut ke dalam deskripsi
Tahap 4b : (untuk rubrik analitik) tulislah deskripsi naratif secara rinci untuk pekerjaan yang sangat sempurna dan sangat tidak sempurna untuk tiap atribut individual
Tahap 5a : lengkapi rubrik dengan pendeskripsian level lainnya pada kontinum yang merentang dari sangat sempurna sampai dengan sangat tidak sempurna untuk atribut kolektif
Tahap 5b : lengkapi rubrik dengan pendeskripsian level lainnya pada kontinum yang merentang dari sangat sempurna sampai dengan sangat tidak sempurna untuk setiap atribut
Tahap 6 : kumpulkan contoh-contoh pekerjaan siswa yang memberikan contoh setiap level
Tahap 7 : revisi rubrik sebagaimana diperlukan
e. Validitas dan Reliabilitas Asesmen Berbasis Performa
Validitas, dapat ditingkatkan dengan cara berbagi dengan siswa tentang kriteria yang akan digunakan untuk men-judge pekerjaannya. Harus dipastikan bahwa performa bukan merupakan tugas spesifik. siswa harus lulus/melampaui ketrampilan prasyarat yang sesuai untuk mendemontrasikan ketrampilan yang kompleks yang mungkin dipersyaratkan oleh tugas. Tugas-tugas harus fair untuk semua siswa.
Reliabilitas, untuk meningkatkannya rubrik harus didesain sedemikian rupa sehingga dapat mereduksi subjectivitas. Guru harus mencegah bias personalnya dalam penskoran tugas
f. Keuntungan dan Keterbatasan Asesmen Berbasis Performa
Keuntungannya antara lain: a) dapat mengases kemampuan siswa untuk melakukan (“to do”), b) dapat mengases ketrampilan siswa yang tidak dapat diases dengan metode tradisional, c) dapat mengases proses berpikir seperti produk, d) dapat digunakan untuk meningkatkan proses pembelajaran praktis.
Keterbatasannya antara lain: a) Batasan umumnya merupakan keseluruhan waktu yang rumit, b) tidak efisien ketika digunakan untuk mengases ketrampilan tingkat rendah, c) akibat dari subyektivitas, reliabilitasnya cenderung rendah, d) siswa berkemampuan rendah cenderung menunjukkan frustasi.
3.3 ASESMEN PORTOFOLIO
Portfolio assessments mempersyaratkan adanya akumulasi bukti-bukti yang diperoleh selama beberapa/sepanjang waktu. Beberapa subject areas atau seting kelas khusus memandang asesmen portfolio mempunyai focus yang berbeda.
a. Karakteristik Portfolio Assessments
Portfolio assessments merupakan bentuk asesmen yang penuh dengan tujuan, mengorganisasikan kumpulan pekerjaan siswa yang dapat digunakan untuk mendeskripsikan usaha, kemajuan atau pencapaian/prestasi siswa. Ide asesmen portfolio diperoleh dari portfolio artis atau penulis yang kemudian diadobsi di lingkungan akademik. Asesmen ini memberikan makna kepada siswa untuk menunjukkan apa yang dapat mereka kerjakan dengan myata.
Asesmen portofolio didasarkan pada kenyataan yang terjadi sesungguhnya atau the real world. Produk dan performa siswa dikompilasikan dalam sebuah upaya untuk menunjukkan kemahiran atau kemajuan siswa sepanjang waktu.
Beberapa sifat turunan dari asesmen portofolio dari folder contoh pekerjaan antara lain adalah: a) siswa harus diikutkan dalam proses, b) criteria pemilihan pekerjaan harus diidentifikasi, c) criteria pengambilan keputusan nilai pekerjaan harus dikembangkan, d) bukti refleksi siswa harus ada.
Guru memberikan petunjuk dan pekerjaan secara kolaboratif dengan siswa untuk mengidentifikasi goal dari sample portofolio dan pekerjaan untuk disertakan. Guru dan siswa melanjutkan saling akses ini untuk menentukan isi (lebih banyak berpusat pada siswa ketimbang bentuk asesmen kelas lainnya). Dapat diadaptasikan untuk menemukan pembelajaran individual yang diperlukan (setiap portofolio diperlakukan secara individual).
Refleksi siswa memberikan kesempatan pada siswa untuk berpikir tentang bagaimana berpikir (beberapa siswa tidak biasa dengan ide ini).
Apakah ada satu metode yang sangat baik untuk menunjukkan metode dan cara berpikir yang digunakan oleh siswa, sebaik produk akhir (portofolio)? Berbeda dengan bentuk asesmen lainya, portofolio cenderung focus pada pencapaian siswa, bukan pada kesalahan. Portofolio menekankan kekuatan yang ada pada siswa. Portofolio dapat menghabiskan waktu yang banyak (proses mereview yaitu menguji portofolio secara kontinu sepanjang pertemuan dengan siswa secara individual).
Tiga ciri utama dari berbagai bentuk portofolio antara lain: a) merupakan koleksi pekerjaan siswa yang mempunyai tujuan khusus, b) siswa harus dilibatkan aktif dalam proses pemilihan pekerjaan untuk dimasukkan dalam portofolio, c) siswa harus secara aktif melakukan refleksi diri.
b. Penggunaan Portofolio
b.1 Format ideal.
Didesain untuk dua tujuan utama, yaitu: 1) portofolio harus merupakan model pertanggungjawaban secara personal dalam merefleksikan pekerjaan orang/siswa itu sendiri, 2) portofolio harus menjadi dokumen perkembangan dan pertumbuhan siswa selama rentang waktu tertentu. Tiga komponen utama portofolio meliputi: 1) dokumentasi perkembangan pekerjaan utama/pokok, 2) bukti pekerjaan siswa selama rentang waktu tertentu, 3) refleksi siswa.
Keterkaitan antara karakteristik utama dengan komponen format ideal ditunjukkan oleh bagan berikut:

Karakteristik Utama Komponen Format Ideal
a) merupakan koleksi pekerjaan siswa yang mempunyai tujuan khusus 1) dokumentasi perkembangan pekerjaan utama/pokok
b) criteria pemilihan pekerjaan harus diidentifikasi 2) bukti pekerjaan siswa selama rentang waktu tertentu
c) siswa harus secara aktif melakukan refleksi diri 3) refleksi siswa

Dokumentasi Portofolio bertujuan untuk memberikan rekaman kemajuan siswa secara actual. Doukumentasi portofolio merupakan sebuah akumulasi bukti-bukti (yakni: usaha, kemajuan, dan prestasi}. Focus pada pendekatan holistic.

b.2 Showcase Portofolio.
Bertujuan untuk menyoroti dan menayangkan keahlian-keahlian. Terdiri dari pekerjaan favorit dan terbaik dari siswa. Sample/contoh harus mendemonstrasikan level tertinggi dari pencapaian. Refleksi siswa merupakan kunci dari portofolio jenis ini.
b.3 Variasi Portofolio lainnya.
Portofolio Kelas, merupakan ringkasan dokumen yang digunakan untuk memberi ilustrasi kemahiran-kemahiran dalam kelas. Tidak termasuk refleksi siswa. Digunakan untuk laporan kepada orang tua siswa dan pengelola sekolah.
Portofolio Evaluasi, digunakan secara eksklusif untuk laporan kepada masyarakat umum dan kepada agensi pemerintah (merupakan sebuah hasil dari proyek hadiah (grant project, curriculum project, dan sebagainya).
c. Peng-kreasian Portofolio
Isu-isu dalam pengkreasian portofolio, guru harus membuat jernih tujuan dari portofolia dibuat (dapat menyatakan jenis portofolio mana yang digunakan). Criteria yang digunakan untuk mengases sample pekerjaan harus dispesifikasikan. Sample pekerjaan harus sejalan/parallel dengan objektiv pembelajaran dan proses pembelajaran yang terjadi. Kerangka waktu untuk mereview harus dispesifikasikan di awal. Pertimbangkan untuk memberi bantuan pada refleksi siswa. Penskoran portofolio harus dilakukan secara terbuka dengan siswa.
Pengembangan Portfolio: prosedur Step-by-Step
Step 1: Tentukan tujuan yang akan dilayani dengan portofolio
Step 2: Identifikasikan isi, konsep dan ketrampilan yang akan diases.
Step 3: Identifikasikan pendekatan untuk mengorganisasikan.
Step 4: Rencanakan satu proses review yang efisien dengan mengembangkan rangka waktunya.
Step 5: Tentukan kapan dan bagaimana siswa dilibatkan.
Step 6: Kembangkan rubrik penskoran (scoring rubrics).
Step 7: Susunlah multiple reviewers untuk meningkatkan reliabilitas portofolio.
Step 8: Rencanakan sebuah konferensi final (final conference).

d. Keputusan Isi.
Dalam banyak sekali situasi, siswa yang paling bertanggungjawab untuk memilih isi dari portofolio (tentu saja berkolaborasi dengan guru). Bagaimanapun, guru harus membuat jernih criteria spesifik untuk ditemukan dalam sample pekerjaan. Tidak terbatas pada apa yang dimasukkan dalam portofolio: harus diselaraskan antara goal, objective pembelajaran, dan produk siswa sebagai dasar dari asesmen .
e. Validitas dan Reliabilitas Asesmen Portofolio
Validitas, berhubungan penting dengan: a) kemampuan khusus siswa dinyatakan oleh sample yang ditentukan lebih lanjut, b) pilihan pekerjaan harus merepresentasikan keseluruhan domain, c) rubrik penskoran harus cocok dengan pekerjaan yang ada dalam portofolio.
Reliabilitas, merupakan konsistensi yang diinterpretasikan sebagai persetujuan antar penilai (interrater agreement). Rater atau penilai yang jumlahnya lebih dari tiga (ganjil) untuk menilai satu sample dapat memfasilitasi konsistensi ini. Selama reliabilitas cenderung rendah, portofolio harus tidak harus digunakan sebagai semata-mata penilaian terhadap performa siswa.
f. Kelebihan dan Keterbatasan Asesmen Portofolio
Kelebihan, secara substansial melibatkan siswa dalam proses, b) dapat menunjukkan pertumbuhan siswa selama rentang waktu tertentu, c) mendidik komunikasi antara guru dan siswa, d) mempersyaratkan suatu peran mandiri untuk siswa dan guru.
Keterbatasan, kelemahan dalam validitas dan reliabilitas.
3.4 ASESMEN TES OBYEKTIF
Merupakan teknik asesmen tradisional (tes obyektif dan subyektif) telah digunakan selama bertahun-tahun yang lalu. Ada kecenderungan seorang pendidik percaya bahwa perkembangan itu sederhana dan terus maju ke depan. Pengembangan tes itu mudah, tetapi mengembangkan tes yang baik memerlukan pengetahuan dan ketrampilan.
a. Karakteristik Umum
Tes obyektif memiliki satu respon yang dianggap benar, tanpa menghiraukan siapa yang menskor respon-respon itu, akan ditemukan skor-skor yang identik.
Obyektif berimplikasi pada bahwa keputusan subyektif tidak mempengaruhi skor individual siswa. Juga dikenal sebagai “selected-response items” dan “structured-response items”. Meliputi bentuk pilihan ganda,dan menjodohkan. Biasanya digunakan untuk mengases ketrampilan berpikir tingkat rendah seperti pengetahuan, pemahaman dan aplikasi (ketrampilan berpikir tingkat tinggi lebih sulit untuk ditulis). Relatif mudah untuk diselenggarakan, diskor dan dianalisis. Penulisan butir dengan kualitas tinggi mempersyaratkan waktu secara substansial. Walaupun subyektivitas dapat dihindari dari proses penskoran, derajad subyektivitas secara substantif ada dalam penentuan muatan isi yang dikandung oleh butir-butir tersebut. Tebak-tebakan dalam merespon merupakan sebuah kenyataan yang hampir pasti terjadi.
Panduan umum dalam menulis butir tes obyektif: 1) tes obyektif harus mencakup isi dan ketrampilan yang penting, 2) kosa-kata dan tingkat pembacaan dari tiap butir harus menjadi kemungkinan yang mendasar, 3) setiap butir obyektif harus dinyatakan dalam pernyataan yang tidak multi tafsir, dan kerancuan kata maupun struktur kalimat harus dihindari, 4) butir obyektif tidak harus terdiri dari pernyataan-pernyataan kata demikata atau frase harus dihilangkan dari teks, 5) kunci untuk menjawab yang benar tidak diberikan.
Petunjuk pemformatan tes obyektif: 1) variasikan bentuk-bentuk butir yang tampil dalam tes kelas, 2) kelompokkan butir-butir yang sejenis dalam format bersama kemudian masing-masing tipe tampilkan dalam sebuah bagian yang terpisah, 3) setiap bagian harus didahului oleh petunjuk yang jernih, 4) dalam tiap bagian, mengandung butir yang mudah sampai dengan sulit, 5) walaupun semua butir tidak akan tampil pada setiap tes, butir-butir itu harus disusun dalam susunan benar-salah, menjodohkan, jawab singkat, pilihan ganda, dan esai, 6) berikan rung yang cukup bagi siswa untuk merespon tiap-tiap butir, 7) hindari pemenggalan sebuah butir dalam 2 halaman.
Petunjuk umum untuk penulisan tes obyektif:
1) mulai pengembangan tes dengan tabel spesifikasi: (a)bagan yang menunjukkan tujuan pembelajaran, isi, dan taksonomi Bloom; (b) tentukan kategori utama dari isi, dalam baris-baris; (c) nyatakan 6 tingkat domain kognitif Bloom dalam kolom-kolom; (d) tuliskan dalam sel-sel jumlah butir atau persentase butir yang dikembangkan untuk isi dan tingkatannya
2) berikan jaminan (pastikan) bahwa tes mencakup sample-sampel isi secara akurat dan representatif
3) pilihan penggunaan tes obyektif yang disarankan: (a) pertimbangkan pertanyaan dasar: apakah butir cocok/sejodoh dengan pembelajaran yang diterima siswa?; (b) buku ajar harus hati-hati diuji kesesuaiannya.
4) Penskoran relatif mudah: gunakan kunci jawaban untuk sampai pada jumlah total butir yang dijawab dengan benar oleh siswa
b. Tipe-tipe Tes obyektif:
b.1 Pilihan Ganda
Format dasar yang terdiri dari sebuah pernyataan/pertanyaan dan pilihan jawabab (hanya satu pilihan yang benar, dan yang lainnya disebut dengan distractors). Pernyataan dapat berupa pertanyaan atau melengkapi pernyataan. Ada tiga sampai dengan lima pilihan. Sangat berguna untuk mengases ingatan fakta dan aplikasi pengetahuan. Dapat juga digunakan untuk mengases ketrampilan berpikir tingkat lebih tinggi (lebih sulit untuk dituliskan).
Panduan umum pengembangan tes pilihan ganda:
1. pernyataan harus jernih menyatakan masalah yang menjadi perhatian siswa,
2. semua pilihan jawaban harus parallel dalam jenis isinya
3. pilihan harus menghindari pengulangan kata
4. kata benda atau kata sifat yang secara substansial merubah makna pernyataan atau pilihan harus ditekankan
5. semua distraktor dalam seperangkat respon harus masuk akal
6. tata bahasa dalam setiap pilihan harus konsisten dengan pernyataan/pertanyaan
7. butir harus menghindari penyertaan ungkapan “semua … di atas” , atau kebalikannya atau pilihan jawaban yang ekivalen
8. butir harus tetap independen satu dengan lainnya
9. hindari petunjuk kunci jawaban seperti satu ungkapan kunci, antara pertanyaan/pernyataan dengan pilihan yang benar
Keuntungannya antara lain: a) dapat untuk menguji sample domain isi secara efisien dan komprehensif, b) dapat digunakan dalam semua subjek area secara semu, c) dapat diskor dengan relatif cepat, d) penskoran merupakan sebuah proses obyektif, e) dapat memberikan informasi diagnostik.
Keterbatasannya antara lain: a) mudah terpengaruh oleh tebak-tebakan, b) penyusunannya memakan waktu.
Ragam dari pilihan ganda: a) variasi jawaban benar dan jawaban terbaik, b) kombinasi butir pilihan ganda dan esai jawaban singkat, c) butir pilihan ganda metakognitif (“jelaskan jawabanmu………”), memberi kesempatan kepada siswa untuk menjelaskan dan merefleksikan pemikirannya.
b.2. Menjodohkan
Format dasarnya terdiri dari dua daftar yaitu daftar pernyataan/pertanyaan (stimuli) dan daftar jawaban. Harus terjadi korespondensi satu-satu antara daftar stimuli dan daftar jawaban. Dianggap sebagai satu kasus khusus dari butir pilihan ganda. Dapat mengases ketrampilan pemahaman dan pengetahuan. Secara khusus sangat berguna dalam pengukuran pemahaman konsep atau bentuk-bentuk yang saling berhubungan.
Panduan umum pengembangan butir tes menjodohkan:
1. daftar stimuli maupun jawaban harus homogen
2. petunjuk penjodohan harus dibuat jernih
3. hindari penjodohan sempurna dengan penempatan daftar jawaban lebih banyak ketimbang daftar stimuli
4. gunakan daftar stimuli dan jawaban yang relatif singkat
5. tempatkan frase yang lebih panjang dalam daftar stimuli dan yang lebih pendek pada daftar jawaban.
6. susunlah daftar tersebut dalam urutan yang logis
Keuntungannya antara lain: a) memberi peluang untuk mengases konsep, ide dan fakta yang saling terkait dengan lebih efisien, b) relatif lebih mudah disusun/dikembangkan, c) pada dasarnya merupakan kombinasi butir pilihan ganda dengan penggunaan seperangkat jawaban yang sama, d) penskorannya relatif mudah.
Keterbatasannya antara lain adalah: a) mempersyaratkan ide atau konsep yang berkaitan dalam jumlah yang besar, b) sangat sulit didesain untuk ketrampilan tingkat tinggi.
b.3. Pilihan Alternatif
Secara esensial merupakan kasus khusus dari butir pilihan ganda di mana pilihan dibatasi hanya dua pilihan. Jenis paling popular adalah butir benar-salah (true-false item). Ragamnya meliputi: benar-tidak benar, ya-tidak, dan fakta-opini. Dapat efektif jika ditulis dengan hati-hati (meskipun berita negatif). Cenderung overestimate pada prestasi siswa, sementara siswa memiliki peluang 50% untuk asal tebak terhadap jawaban yang benar.
Panduan umum pengembangannya:
1. hindari penggunaan ungkapan absolut dan ketentuan khusus lainnya
2. hindari pengujian pengetahuan trivial/kurang berguna
3. butir-butir dinyatakan dalam kalimat positip; jika pernyataan negatif harus digunakan, tandailah ungkapan negatif dengan garis bawah, tebal, atau cetak miring
4. kira-kira separuh dari seluruh butir harus memiliki kunci jawaban benar dan separuhnya lagi mempunyai kunci jawaban salah
5. pernyataan benar dan pernyataan salah harus memiliki sama panjang
6. butir benar-salah haruslah benar sepenuhnya atau salah sepenuhnya.
Keuntungannya antara lain adalah: a) relatif cepat untuk membuatnya, menjawabnya, dan menskornya; b) dapat diskor secara efisien dan obyektif.
Keterbatasannya antara lain adalah: a) memberi peluang sangat besar untuk menebak-nebak, b) butir-butirnya secara dominan sesuai untuk mengases ketrampilan tingkat rendah.
Ragamnya meliputi: a) butir ya-tidak, b) benar-salah terkoreksi (mempersyaratkan siswa menulis ulang beberapa pernyataan yang salah), c) embedded alternate-choice items, yang menyatakan sederet butir pilihan alternatif di dalam satu paragraph, d) multiple true-false items, merupakan hasil persilangan pilihan ganda dengan pilihan alternatif(pernyataan-pernyataan benar-salah ganda, masing-masing menggunakan pernyataan/pertanyaan yang sama)

c. Analisis Butir
Analisis butir, merupakan analisis secara statistik karakteristik setiap butir yang tampil dalam sebuah tes dengan tujuan membuat keputusan tentang butir yang dipertahankan dan butir yang harus dibuang.
Butir-butir harus dievaluasi: a)ketika butir-butir itu sedang dirancang (menggunakan tabel spesifikasi, panduan dsb), b) mengikuti penyelenggaraan tes dan penskoran.
Ada empat ukuran dasar statistik, yaitu: a) taraf kesukaran butir: proporsi siswa yang menjawab butir dengan benar, b) daya pembeda: perbedaan antara proporsi dari jawaban benar siswa dalam kelompok tinggi dan kelompok rendah, c) analisis distraktor: menguji pola respon/jawaban untuk pilihan salah, d) reliabilitas: konsistensi menyeluruh untuk seluruh butir.
c.1 Taraf Kesukaran
Taraf kesulitan, disimbolkan dengan ρ, secara sederhana merupakan pembagian antara jumlah siswa yang menjawab benar dalam suatu butir dengan jumlah siswa yang merespon/menjawab butir itu. Nilainya dapat merentang antara 0,00 (sulit) s/d 1,00 (mudah). Pertimbangan untuk merevisi butir jikalau ρ 0,80. keputusan yang baik juga harus juga digunakan dalam hubunganya dengan analisis atatistik. Guru dapat mengharapkan seluruh siswa menjawab dengan benar beberapa butir; karenanya ρ = 1,00 mengindikasikan bahwa seluruh siswa telah memahami konsep dengan sangat sempurna.
c.2 Derajad Pembeda
Derajad Pembeda, disimbulkan dengan D, bertujuan untuk menunjukkan bagaimana butir dapat membedakan siswa yang berkemampuan rendah dan siswa yang berkemampuan tinggi (pada keseluruhan tes). Jika sebuah butir berfungsi sebagai pembeda yang baik, maka sebagian besar siswa dalam kelompok kemampuan tinggi akan menjawab butir itu dengan benar dan sebagian besar siswa dalam kelompok kemampuan rendah menjawab butir itu dengan salah. Biasanya nilainya merentang dari +0,10 sampai dengan + 0,60.
c.3 Analisis distraktor
Secara informal menguji pola jawaban lintas semua pilihan pilihan.
c.4 Reliabilitas
Reliabilitas, dihitung dengan KR-21 untuk memperoleh nilai koefisien reliabilitas. Nilainya merentang dari 0,00 sampai dengan 1,00. rentang nilai yang diinginkan untuk tes di kelas adalah antara 0,70 sampai dengan 1,00.
d. Validitas dan Reliabilitas Tes Obyektif
Validitas, harus dapat menjawab pertanyaan-pertanyaan berikut: a) apakah saya sedang mengukur apa yang hendak diukur?, b)seberapakah tingkat kepercayaan yang harus saya miliki untuk keputusan yang akan saya buat berdasarkan pada ukuran-ukuran tersebut. Kecenderungan utamanya adalah validitas isi.
Reliabilitas, dibangun melalui penggunaan analisis statistik, khususnya KR-21, yaitu untuk memperoleh nilai koefisien reliabilitas.

3.5 ASESMEN TES SUBYEKTIF
Butir tes subyektif merupakan alat yang sangat cocok untuk mengases pembelajaran siswa. Lagi pula, ada satu kecenderungan bagi pendidik untuk mempercayai bahwa perkembangannya sederhana dan maju kedepan, tetapi penulisan butir dengan kualitas tinggi memerlukan beberapa praktik/latihan.
a. Karakteristik Butir Tes Subyektif
Butir tes subyektif biasanya tidak memiliki satu jawaban/respon yang benar. Subyektif berimplikasi bahwa keputusan subyektif penskor merupakan satu bagian integral dari proses penskoran. Juga dikenal dengan “free response” atau constructed-response” atau “supply-type” items. Meliputi butir jawab pendek dan esai. Mempersyaratkan siswa agar memproduksi apa yang mereka tahu, dibandingkan dengan hanya pengakuan jawaban terbaik dari satu set pilihan. Relatif mudah untuk dibuat. Siswa memerlukan waktu untuk menjawab/memberikan respon. Dapat memakan waktu dan melelahkan secara subyektif untuk menskor, bergantung pada formatnya.
Beberapa karakteristik umum dari butir tes subyektif antara lain adalah sebagai berikut:
1. Butir tes subyektif harus harus meng-cover ketrampilan dan isi penting.
2. Tata bahasa dan level pembacaan dari setiap butir harus diupayakan pada tingkat dasar
3. Setiap butir tes subyektif harus dinyatakan dalam kalimat yang tidak multitafsir atau rancu
4. tidak memberikan petunjuk tentang kunci jawaban
5. variasikan jenis butir yang ditampilkan pada tes di kelas
6. kelompokkan butir dengan format yang sama sehingga masing-masing tipe tampil dalam kelompok yang saling terpisah
7. setiap bagian harus didahului dengan petunjuk yang jelas
8. dalam setiap bagian, butir disusun mulai yang mudah menuju yang sulit
9. walau semua jenis butir tidak akan tampil pada setiap tes, test, mereka harus disusun dalam susunan seperti berikut: benar salah, menjodohkan, jawab singkat, pilihan ganda dan butir subyektif
10. berikan ruang yang cukup bagi siswa untuk memberi respon pada setiap butir
11. hindari pemenggalan butir ke dalam dua halaman

b. Butir Jawaban Singkat.
Tipe ini mempesyaratkan siswa untuk memberikan satu kata, frase pendek, angka, atau respon/jawaban ringan lainnya. Diformat sebagaimana pertanyaan-pertanyaan lainnya (dikenal sebagai butir jawaban pendek) atau kalimat yang belum lengkap (dikenal sebagai butir melengkapi atau butir mengisi tempat kosong/titik-titik). Sebenarnya beberapa butir melengkapi dapat ditulis sebagai butir jawab singkat atau sebaliknya. Tipe ini dapat mengases ketrampilan atau isi serupa seperti tipe pilihan ganda, tetapi siswa harus mengingat atau membuat jawaban dia (pada tipe pilihan ganda hanya mengidentifikasi dari daftar pilihan yang ada)
Paling efisien untuk mengases ketrampilan berpikir tingkat rendah. Relatif mudah dibuat. Relatif mudah diskor (tidak semudah butir obyektif, sementara jawaban harus ditulis tangan). Ada beberapa isu penting terkait dengan penskoran: 1) ejaan dan struktur kalimat, 2) siswa harus diberitahu jika akan diases dengan tes, 3) siswa bisa saja memberi jawaban benar tetapi tidak sama dengan yang guru maksudkan, 4) guru harus menentukan jika jawaban ini merupakan hasil dari kurangnya kemampuan menulis ataukah kurang belajar (miskonsepsi).
Ragamnya bisa berbentuk pemberian satu daftar jawaban-jawaban yang mungkin: tidak lebih luas dari butir subyektif, hanya merupakan variasi dari butir menjodohkan.
Panduan umum untuk membuat butir jawab singkat:
1. Short-answer items harus disusun kata-katanya secara khusus dan jernih
2. dalam butir melengkapi, letakkan tempat kosong di dekat atau di akhir pernyataan
3. hindari pengkopian pernyataan kata demi kata
4. tuliskan hanya kata-kata yang penting saja
5. gunakan hanya satu atau dua tempat kosong (untuk butir melengkapi)
6. standardkan panjang dari tempat kosong
Keuntungan dan keterbatasan butir jawab singkat. Keuntungan, relatif mudah dibuat, lebih mudah daripada pilihan ganda karena tidak perlu membuat pilihan. Kemungkinan untuk asal tebak dapat direduksi.
Keterbatasan, utamanya hanya digunakan untuk ketrampilan berpikir tingkat rendah. Penskoran dapat menjadi sesuatu yang sulit dikarenakan salah eja dan kurang baiknya struktur kalimat.
c. Esay
Merupakan perntanyaan atau perintah yang mempersyaratkan siswa untuk menulis paragraph atau mengembangkan tema sebagai jawaban. Meliputi ragam ketrampilan berpikir yang lebih luas (siswa harus mengingat, memilih, mengorganisasikan, dan menerapkan). Jawaban bisa merentang dari sedikit/beberapa kalimat (restricted-response items) sampai dengan beberapa halaman (extended-response items); rentangan dalam suatu kontinum.
Sangat cocok untuk mengases ketrampilan berpikir yang kompleks (seperti analisis sintesis dan evaluasi). Kadangkala digunakan secara eksklusif atau sebagai bagian dari asesmen performa yang lebih luas. Tidak cocok digunakan untk mengases ketrampilan berpikir timgkat rendah. Penskorannya merupakan sesuatu kegiatan yang kompleks dan biasanya tidak reliable (akibat pengaruh dari karakteristik jawaban). Penskoran dapat memakan banyak waktu. Penskoran harus mirip dengan penskoran pada asesmen performa, menggunakan rubrik holistic atau rubrik analitik.
Penskorannya dapat dibuat lebih obyektif dengan:
1. menetapkan terlebih dulu waktu untuk sebuah jawaban benar.
2. penggunaan satu cheklist atau rubrik yang dijelaskan dengan hati-hati
3. penetuan apakah ejaan, tata bahasa dsb akan diskor
4. penskoran jawaban siswa dengan tanpa nama (disembunyikan)
5. penskoran untuk seluruh jawaban pada suatu butir tertentu dahulu, baru penskoran untuk butir yang lain, dan seterusnya.
Panduan umum pengembangannya:
1. Essays harus terdiri dari aplikasi pengetahuan yang esensial pada situasi yang baru
2. Essays harusdinyatakan dalam kalimat yang jernih difokuskan pada tugas siswa
3. Tentukan panjang yang diinginkan, batasan waktu, dan criteria penilaian, untuk siswa
4. Kembangkan satu model jawaban
Keuntungan dan keterbatasan butir esay. Keuntungannya antara lain: dapat digunakan untuk memancing ragam jawaban yang luas, siswa diijinkan membuat jawabannya sendiri, peluang munculnya jawaban asal tebak dapat direduksi secara substansial. Keterbatasannya antara lain: penipuan (bluffing) dapat menjadi sebuah problem, sangat memboroskan waktu untuk menskor, cakupan isinya sangat terbatas.
Validitas dan Reliabilitas butir tes esay. Validitas, Harus dapat menjawab pertanyaan-pertanyaan berikut: Apakah saya sedang mengukur apa yang harusnya saya ukur?, seberapakah tingkat keyakinan yang harus sya miliki dalam keputusan yang akan saya buat berdasarkan atas ukuran itu?
Reliabilitas, tidak dapat ditentukan melalui analisis butir. Keputusan akan selalu dibuat (reliabilitas rendah) tetapi reliabilitas dapat ditingkatkan dengan mengikuti panduan pembuatan butir esai.
3.6 RINGKASAN
Asesmen dan keputusan-keputusan evaluatif yang dihasilkannya haruslah akurat sehingga mampu mencegah kekeliruan pemahaman dan komunikasi oleh pihak-pihak terkait. Oleh karenanya diperlukan berbagai jenis asesmen yang secara bersama-sama akan menghasilkan informasi evaluatif yang lengkap dan akurat. Beberapa tipe dan kategori asesmen diantaranya asesmen formal dan informal, asesmen kuantitatif dan kualitatif, evaluasi formatif dan sumatif, asesmen baku dan tak baku, asesmen rujukan norma dan asesmen rujukan criteria, asesmen tes dan asesmen alternatif, asesmen obyektif dan subyektif.
Pemahaman guru terhadap berbagai jenis asesmen ini memberikan peluang baginya untuk merancang berbagai instrumen asesmen dan membangun system asesmen yang menjamin diperolehnya hasil asesmen berupa informasi evaluatif yang lengkap, konsisten dan akurat. Semua keputusan lanjutan yang diambil berdasarkan informasi ini akan lebih pas dan cocok dengan keperluan.