angle-up angle-right angle-down angle-left close user menu open menu closed search globe bars phone store

考试和考试问题的开发方式

ETS 开发的评估具有最高质量、能够准确地评估必要的知识和技能,并且对所有考生都很公平。我们知道,设计出公平、有效并可靠的考试是一个复杂的过程,该过程涉及到多方制衡。

这就是众多专家 - 包括考试专家、考试审核人、编辑、教师和测试主题或技能所在领域的专家 - 参与开发每个考试问题或“考试项目”的原因。 这也是所有问题(或“项目”)都经过层层严格审阅并符合测试领域有关质量和公平之最高标准的原因。

观看短片,了解 ETS 如何设计公平而有意义的考试和考试问题(Flash, 5:59)。

立即观看> (英语内容)
观看字幕>

为帮助您进一步了解我们的流程,现在为您展现 ETS 开发全新考试时采取的关键步骤概述。

步骤 1: 确定目标

教育者、许可委员会或专家协会确认考察某些技能或知识的需求。开发考试以适应此需求的决策制定后,考试开发者将询问一些基本问题:

  • 参加考试的对象及其目的是什么?
  • 考试应考察哪些技能/或知识领域?
  • 考生应能够如何运用他们的知识?
  • 考试应包含哪些问题? 每个种类应包含多少题目?
  • 考试应持续多长时间?
  • 考试的难易程度应如何?

步骤 2: 项目开发委员会

步骤 1 中的问题答案通常在项目开发委员会的帮助下完成,委员会成员通常在主办机构或协会指导下由教育者和/或 ETS 委派的其他专家组成。项目开发委员会的职责可能包括:

  • 确定考试目标和规范
  • 帮助确保考试问题的公正
  • 确定考试形式(例如,选择题、作文、建构性回答题等)
  • 考虑补充考试材料
  • 审阅 ETS 工作人员编写的考试问题或考试项目
  • 编写考试问题

步骤 3: 编写并审阅问题

ETS 工作人员或项目开发委员会编写的每道题目都会经历无数次的审阅和修订,以确保题目尽可能地清晰、拥有唯一正确的选项并且符合整个考试的风格原则。简答题、作文和口头回答题等开放式题目的评分指南也会经历类似的审查。

步骤 4: 预备考试

大多数问题在编写并审查后将在类似测试对象的样组中进行预先测试。考试结果可令试题开发者确定:

  • 每个问题的难度
  • 问题是否模棱两可或令人误解
  • 问题是否应修改或删除
  • 错误的备选答案是否应修改或替换

步骤 5: 发现并移除不公平的问题

为遵循严格的 ETS Standards for Quality and Fairness (英语文本) 指导原则,经过培训的审阅者必须仔细检查每个考试问题、测试本身及任何描述性或预备材料,以确保删除任何通常被视为性别歧视、种族主义或其他任何对接受测试的小群体不适合或具冒犯性的语言、符号、单词、短语和内容。

ETS 统计学家还可以通过被称为差异试题功能 (DIF) 的方法来确定某些特殊问题,两组展示出具有类似知识或技能的考生在这些问题上表现出很大不同。如果某组考生在特定问题上始终表现出优于另一组,则该问题将接受额外审查并可能被视为不公正或不符合要求。注: 请注意:如果不同组的考生在相关知识或技能的平均水准方面实际上存在差异,那么公平的考试问题将反映出这些差异。

步骤 6: 整合考试题目

考试问题组合完成后,其他专家、委员会成员,有时还有其他外部专家,将会对其进行审查。每位审阅者都将独立地回答全部问题,并将正确答案列表提交给考试开发者。这些清单将与 ETS 答案进行比较,以验证预期的答案确实是正确答案。我们将在考试发布之前解决任何矛盾之处。

步骤 7: 确保 - 即使在考试举行后 - 试题正常发挥作用

即使在考试已经举行之后,统计学家和考试开发者也要审阅考试,以确保考试问题发挥了预期作用。在最终分数产生之前,每个问题都将经过初步统计分析,并且其结果将接受逐个问题的审查。如果发现了问题,例如确认了某一问题的误导答案,我们将在最终评分以及分数发布之前采取该“问题不予评分”等纠正措施。

考试还将进行可靠性审查。考生在某一版本测试中的表现应合理地预测出在任何其他版本测试中的表现。如果可靠性较高,那么无论考生完成的是哪一版本的测试,其结果都大体相同。

Promotional Links