• 您现在的位置: 中国兴华科学教育网 >> 科教资源 >> 科学考试院 >> 考试评价研究 >> 正文
    国家教育进展评估的效度研究
    作者:戴维•西森(美)    文章来源:《考试研究》2012年第二期    点击数:    更新时间:2012-5-18

    2.表现水平(Achievement Levels)  

    20世纪90年代初,国家评估管理委员会引入“表现水平”的概念,从此表现水平就饱受诟病。这一概念的引入代表着NAEP结果报告的重点在发生变化。最初,“全国评估的主要目的是衡量孩子和年轻人在知和做方面的变化”(TukeyAbelsonCoffmanJonesand Mosteller1971)20世纪90年代初,国家评估管理委员会重新界定NAEP的目的,“表现水平设定是一种划定NAEP量表分数的过程,它代表了刚刚达到某一标准的学生应该具有该标准表现水平描述中说明的知识和能力(National Assessment Governing Board2011)。其中加入的“应该”这个词,把NAEP分数报告从最初的“描述性”变成了“指导性”。  

    表现水平标准至少有两个目的:  

    (1)它使得测试结果能够被这样报告:“达到或高于某一水平的百分比是……”这种形式的报告对某些使用者(如新闻记者)很具吸引力。  

    (2)(有些人相信)利用表现水平可以将测试结果报告为达到某个客观标准的学生的百分比。  

    第二个目的在原则上很有争议。不过,批评利用表现水平来进行结果报告的焦点一直集中于确定划界分数的技术上。  

    起初,NAEP确定表现水平划界分数时使用的是“安戈夫法”,目前使用的是自定义版的“书签法”。这两种对“题目的判断”方法都基于一个事实,即每一道试题的IRT估计难度值都会被统一到学生的能力表现量表上。表现水平概念引入之初,ShepardGlaserLinnBohrnstedt(1993)指出,“安戈夫法在根本上是存在缺陷的,不适合用来设定表现水平。”在对NAEP的评估过程中,ShepardGlaserLinnBohrnstedt(1993)建议国家评估管理委员会:  

    ·停止使用安戈夫法;  

    ·停止使用1992年的表现水平报告;  

    ·邀请课程内容专家、商业领袖和标准委员会对NAEP结果的意义、理想的表现标准等进行讨论;  

    ·将1994年确定的表现水平与NAEP官方报告分开公布,声明这些都是草案或尚在完善中;  

    ·使用1990年和1992年的百分位分数来监测未来评估的成绩;  

    ·使用或参照国际比较为美国的教育状况设定基准。  

    尽管上述建议都未被执行,但后来的安戈夫法的标准设定仍然进行了一些调整。此后,PellegrinaJonesMitchell(1999)在总结与评估NAEP时提出以下建议:  

    ·现行设定表现水平的方法应该被取代;  

    ·NAEP现行的表现水平可以继续使用,但还是需要不断完善;  

    ·国家评估管理委员会应该申明,表现水平是通过主观判断程序设定的。  

    上述建议也都没有得以实施。国家评估管理委员会仍然强调表现水平是NAEP分数报告的主要方式。CizekBunch(2007)在书中肯定了标准设定的方法,同时介绍了其他多种方法。Cizek(2001)的另一本书也深入总结了国家评估管理委员会对于目前标准  

    设定方法的正面支持态度。(Loomis and Bourque2001)  

    表现水平仍然是NAEP分数报告系统的主要基础。用什么方法来取代表现水平,依旧是NVS专家小组会议经常讨论的问题。目前,可能的替代方法或者是在某个基准年份使用任意给定分数(arbitrary scores)的量表锚定法(scale anchoring),这种方法在20世纪80年代曾使用过,其量表分数可以是150200250等,或者是使用百分等级分数,如第25 百分位、第50 百分位、第75 百分位、第90 百分位等。  

    上一页  [1] [2] [3] [4] [5] [6] [7] [8] [9] 下一页


    网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    姓名: E-mail:
    评分: 1分 2分 3分 4分 5分
    内容:
    验证码: