• 您现在的位置: 中国兴华科学教育网 >> 科教资源 >> 科学考试院 >> 考试评价研究 >> 正文
    基于经典测量理论和项目反应理论的等值与连接(一)
    作者:约瑟夫•M•瑞安(美)    文章来源:考试研究 2011.1    点击数:    更新时间:2011-3-9

    测试目的

    教育测评项目中的测试成绩通常含有多方面的目的其中包括但不局限于以下方面利用测试成绩增强教师教学、学生学习的效果衡量学生取得的进步评估不同课程体系和教学方法的效率。此外将测试成绩与其他一些信息相结合可以对学生未来的学术和其他成就作出预测。因此要对两个不同的测试版本进行等值实际上就是要求这两个测试版本能够同样有效、完满地实现该项测评的目的。

    对于大规模的测试项目来说等值是非常重要的。因为同一考试机构会使用大量不同的试卷而且这些试卷每年甚至更频繁还都会有所变化。这样的测试项目面临的主要挑战在于由于不同的测试版本所考查的内容和目的是一致的它们之间的评分标准和意义需要保持一致。这就是对测试的效度提出的考验因此在构建不同版本的测试时保证测试成绩具有一致的解释并能一样完美地服务于相同测试目的是非常关键的。

    测试规范test specifications

    在这一系列论文中笔者所关注的焦点是测试等值与连接中技术上、心理测量上的概念和程序。然而要想取得测试等值的成功最有价值的步骤却不在统计或者心理测量的范围之内。事实上测试等值中最关键的环节一是在于为不同的测试版本准备相似的题目二是在不同的试卷版本中有同等的涵盖考查内容相同、认知水平相同、试题模式相同的题目。

    编制试题和测试规范的活动本身就是一项制定规范的过程而且这项活动所需要的东西往往会超出心理测量专家的经验和专业知识。在目前对于学生应该掌握的知识和技能所进行的系统性描述中存在很多不同的框架。Bloom1956所著的《教育目标分类》也许是其中最知名的经典原型在该书所提出的框架中对学习的定义是从知识的认知过程角度进行的包括识记、理解、应用、分析、综合、评估。想要构建等值的测试版本各个版本中就需要等量地涵盖考查以上几个认知层次的题目而且所考查的内容也要相同。Anderson& Krathwohl2001在他们的大作《学习、教学、评估分类 Bloom的教育目标分类的修改》中针对Bloom的观点提出了很有意义的补充。另外还有一些有影响力的机构和学者也提出了他们自己对学习分类的框架包括美国教育进展评估National Assessment of Educational Progress NAEPRobert MarzanoJohn Kendall2007Norman Webb1997这些框架都提出了一组与认知过程或知识内容有关的学习维度。

    最关键的问题并不是该采用哪一种框架而是人们必须编制出一套清晰、明确、通俗易懂的方法来说明试题和测试所考查的具体是什么而且要将这一套说明方法当作编制试题和试卷的蓝本。假如不能对测试的考核内容作出清晰的定义我们无法想象这个测试的效度将如何评价。

    测试规范中除了内容和认知过程以外还包括试题的形式和呈现方式。试题的呈现方式包括纸笔测试、计算机化测试computer based administration of fixed test和计算机适应性测试三种Mills 2002。试题形式则包括选择答案题型如选择题、判断题、连线题等、自拟答案题型如简答题、延伸题等和完成任务题型如编制图表、完成实验等。测试规范中有必要包括对试题形式和呈现方式的说明这样一来测试规范就包括学习内容、认知过程、试题形式和呈现模式四个部分。

    对试题和测试规范的讨论并不总是出现在对等值与连接的论述中。然而在试题命制的过程中尽可能地保持试题和试卷的相似性是实现等值的重要环节。如果不同的测试版本在内容、认知过程、试题形式、呈现方式上都很匹配那么对成绩进行的等值实际上就是在试题命制阶段的等值的基础上进行的细微改良。反之如果测试在以上几个重要方面都不相匹配学生的测试成绩就会受到影响等值操作仍然能够得出一个数字上的结果但是这个结果却无法使试卷实现等值

    上一页  [1] [2] [3] [4] [5] [6] [7] [8] [9] [10]  ... 下一页  >> 


    网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    姓名: E-mail:
    评分: 1分 2分 3分 4分 5分
    内容:
    验证码: