持续改进

评估的客观性和主体性


如果我们把评价的客观性和主观性看成一个连续体,我们可以沿着它的长度来代表各种评价和评分方法。

可以客观评估的测试项有一个正确答案(或者一个正确的响应模式,对于更复杂的项目格式)。评分者不需要判断答案的正确与否。他们通常根据答案来标记考试。在某些情况下,客观测试由扫描仪和电脑评分。客观测试通常由selected-response项格式,例如多项选择题、配对题和对错题。在客观评分的考试中包括选择的答案的一个好处是,可能的答案的范围被限制在答题者提供的选项范围内,答题者不能提供其他可接受的答案。

因为我们在阅读和听力理解测试中所评估的很多内容首先是由答题者解释的,所以在客观评分的项目中存在一定程度的主观性。因此,对解释模式的评估,即使是那些由“一个正确答案”组成的项目,可能也不会一直被放在连续体的客观末端。

即使是最简单的构造 - 响应项目格式。答案密钥可以指定一个单词,填充项目的正确答案,但实际上可能有多个,可接受的教师或测试开发人员没有预料到的对该项的可选响应。在课堂测试的情况下,教师可能会认为一些回答是相同的或部分正确的,并应用一些主观判断来完善他们的评分标准,因为他们给测试打分。对简答题的非正式评分标准可能在课堂测试中很管用,只要它们被一致地应用,并且是可靠的。

就像可能有很少有诸如第二语言知识和技能的客观措施一样,因此很难找到纯粹的绩效的主观评估。允许得分手确定学习者成绩的主观印象是大多数学生,父母或其他利益相关者都无法接受。我们通常不必证明我们认为艺术品的工作是好的或坏的 - 我们只是喜欢它或我们没有。由于我们的判断对艺术家没有重大影响(除非我们是艺术批评者),因此主观评估是可以接受的。这也不是一个问题,艺术品的许多观众不同意其质量。

布朗和阿贝维克拉马(2010)建议有五个判断评估的基本标准:

  1. 实用性:在预算之内;可以在适当的时间内完成;为设计和评分考虑时间和精力
  2. 可靠性:统一的评分标准,便于不同的评分者一致使用;任务项对于完成任务的人来说是明确的
  3. 有效性:衡量它建议衡量的内容;提供有关该人的能力的有用,有意义的信息
  4. 真实性:项目/任务是上下文化而不是孤立的;有意义,相关,有趣的主题;复制现实世界任务
  5. 剥离:积极影响教师的教学方式和学习者的学习方式;给予学习者反馈,以促进他们的语言发展。

Carla邮件列表注册 接触卡拉 卡拉活动 捐赠给卡拉 卡拉在Facebook上 Carla在YouTube. 推特
语言习得高级研究中心(CARLA)•140大学国际中心•331 - 17 Ave SE•明尼阿波利斯,MN 55414