• 您现在的位置: 中国兴华科学教育网 >> 科教资源 >> 科学考试院 >> 考试评价研究 >> 正文
    基于经典测量理论和项目反应理论的等值与连接(一)
    作者:约瑟夫•M•瑞安(美)    文章来源:考试研究 2011.1    点击数:    更新时间:2011-3-9

    二、等值与连接意义和困惑

    等值与连接的基本概念

    等值”(equating是一个测量术语指的是为了在两个及以上的测试版本的成绩之间建立成对关联使之具有同样的意义而设计的一系列程序。在将两个不同测试版本的成绩进行等值时包含两重意义第一层就是简简单单地让不同测试版本的原始成绩或者衍生成绩之间可以转化、对应或者相提并论从而能够替换使用第二层意义则远不止对应成绩那么简单它让不同的成绩通过等值后能够体现对考生知识、能力相同的解读和推断而且在此基础上能够进一步采取相同的适当的行动。

    等值是一个能够在同一项测试的不同版本之间构建具有相同意义的并可比较成绩的技术程序有了它不同的考卷就可以替换使用。只要进行过确实的等值操作某个学生或者某组考生用哪一套试卷进行测试就变得无关紧要了。在许多大规模的测试项目中等值都有非常关键的作用因为这一类测试都需要使用不止一套试卷。在各种现实原因的影响下同一个测试机构可能会使用大量不同的试卷。此外试卷的形式也会逐年发生变化甚至频率要更高。

    人们对连接linking和等值equating两个术语经常混淆有时还替换使用。连接是更广泛的术语对两个测试版本建立相配或者成对的关系并没有要求该成对的成绩具有相同的实质含义。连接和等值是不同概念连接对成绩的解释能力弱于等值。人们的困惑有些可能源于它们两个都采用相同的技术步骤。同时某些步骤如等百分位等值”(equipercentile equating已经成为测量和心理测量学常用的词组。连接测试即使采用等百分位等值也不一定导致形成等值的测试版本。

    在连接与等值中一份试卷得出的成绩要和另一份试卷的成绩建立相配或者成对的关系。换句话说一份试卷的成绩需要转化到与另一份成绩相同的量表或者一份通用量表上去。例如在标准型测试standards-based assessmentt简称SBA即以检验固定的标准内容为目的的测试中得出的成绩将能够连接或者对应到标准的常模参照测试norm-referenced test简称NRT成绩上去。通过这样的连接我们可以得到一个两列的表格其中的每一行都将一个标准型测试SBA成绩与一个常模参照测试NRT成绩联系起来反之亦然),这样就将两个测试成绩连接起来了如表1

     

    这样的连接可以用如下的短语进行恰当地描述

    在标准型测试中得分为325的学生将极有可能在常模参照测试中得到422分。”“在常模参照测试中得到437分的学生很可能在标准型测试中得到341分。

    相比于仅仅将两个测试的成绩连接在一起对两个测试所做的等值具有更强的意义。例如如果我们成功地将一项于2009年进行的五年级数学考试与2010年进行的相同的考试等值起来我们可以说:“就所考查内容的范围来说在两次测试中取得相同成绩的学生所掌握的知识与技能的水平也是相同的。

    当我们说这两份试卷是等值的我们所表达的意思就是它们考查的是相同的内容和认知程度对学生掌握的知识、技能作出了相同的解读和推断。有了这些强有力的断言我们就能够在包括一些对学生和其他人意义重大的测试中替换使用等值的试题版本。

    但是如果我们说两份试卷是连接的”,那意义就大不一样了。连接能够说明不同测试的成绩之间是相互关联的但是却无法说明这些测试具有相同的解读、推断以及成绩的互相使用是有效的。和连接一样等值也可以说明两个测试之间的关联但是它还具有更深一层的含义那就是这一对成绩含有相同的实质意义。

    要想区别连接与等值我们可以把等值看做连接这个连续统一体上的一个极端如图1所示。

     

    1  连接的连续统一体

    这个连续统一体的右侧所表现出的就是在有意构建的等值测试中所表现出的测量状况。此时两个甚至多个不同的测试就可以正式沿着一定的程序进行等值具体操作在本系列论文的另外篇章中将作交代。针对同一内容、属于同一年级的测试将会被设计成尽可能的相似这样一来所得出的运算数据就可以直接用于等值之中。图1的左侧所表示的则是另外的情况——两个不同的测试成绩的连接此时我们不能说某一个测试的成绩与另一个测试成绩具有相同的意义。

    分布在这个连续统一体两端之间的则是一些严格意义上说近似于等值的测量状况但是这些状况仍不能完全满足等值的要求。Mislevy1992对这一分布作出了说明他将测试之间的连接分成了四类调整moderation 、推算projection、校准calibration和等值equating Mislevy199221~26。在他的模型中调整是最弱的一类连接而等值则是最强的可以让不同的测试成绩最大程度地替换使用这四个术语将在后面的文章中详细说明

    如图2所示右侧的等值是最强的一种连接其他较弱的连接则都在图的左侧。在这个图中达到等值一侧的连接需要更严格的要求以使两个或者多个测试版本能够替换使用那些无法达到这些严格标准的连接可以说是像右侧运动”,但是仍旧不算是等值。

     

    2  连接的连续统一体:不同的方法

    上一页  [1] [2] [3] [4] [5] [6] [7] [8] [9] [10]  ... 下一页  >> 


    网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    姓名: E-mail:
    评分: 1分 2分 3分 4分 5分
    内容:
    验证码: