• 您现在的位置: 中国兴华科学教育网 >> 科教资源 >> 科学考试院 >> 考试评价研究 >> 正文
    国家教育进展评估的效度研究
    作者:戴维•西森(美)    文章来源:《考试研究》2012年第二期    点击数:    更新时间:2012-5-18

    二、人口和抽样问题  

    1.依据年龄抽样(目前用十“长期趋势评估”中)  

    为了获得美国年轻人在基本学业成就方面的变化信息,NAEP开发了长期趋势评估(Long Term Trend)。它被用于监测40年前设定的趋势线(trend lines)的走向。在过去几十年中,长期趋势评估曾定期报告9岁、13岁和17岁学生的数学、阅读和科学成绩及4年级、8年级和11年级学生的写作成绩。  

    1999年,由于技术原因NAEP停止了写作评估。2004年,国家评估管理委员会考虑到科学领域的最新进展和内容变化,认为科学评估需要调整,因而又停止了科学学科的长期趋势评估。  

    但是NAEP仍然继续对阅读和数学进行长期趋势评估,并保留了“旧”评估的试题形式以及依据年龄抽样的做法。NAEP在采用“新设计”之初,长期趋势评估也使用了与NAEP主评估相似的项目反应理论量表。而早期的数据则通过一种非项目反应理论程序进行连接。  

    2004年,为了恢复长期趋势评估的活力,NAEP进行了以下改变。包括:  

    ·取消科学和写作题目;  

    ·接受残疾学生和英语学习者参加评估;  

    ·取消内容过时的题目;  

    ·开发独立的问卷;  

    ·在多项选择题中去掉“我不知道”这个选项;  

    ·使用与某一学科领域相关的评估手册;  

    由于评估设计以及具体的操作程序发生了变化,NAEP还进行了一项特别的过渡性研究,来评估这种变化会对评估结果产生怎样的影响。  

    2.以年级为基础的抽样  

    采用新设计的NAEP将原来对9岁、13岁和17岁学生的评估改为对4年级、8年级和12年级学生进行评估。对于教育政策的制定者来说,与年级相关的评估结果更便于对学校的绩效进行推断。但是,由于难以获得学生在作答时更为积极的动机水平,12年级的评估在过去几十年里一直面临困难。因此,NAEP的重点主要是在4年级和8年级。  

    3.全国教育进展评估(National NAEP),试验性州级评估(Trial State AssessmentTSA),试验性城市区划评估(TUDA)  

    NAEP实行早期,教育者担心受到州级评估结果的影响,政府官员也一直在抵制州级评估。直到20世纪80年代末,人们才逐渐意识到州级评估的政治作用。1988年,国会授权NAEP进行“试验性州级评估”(TSA)1990年“试验性州级评估”正式启动。2001年《一个孩子也不能落后》(NO Child Left Behind)法案通过后,州级评估已成为该法案不可或缺的组成部分。  

    4.“全样本”(Full)或“扩大样本”(Expanded)估值  

    由于NAEP的评估结果越来越多地被用来进行比较(历时比较、不同行政辖区间的比较等),公众开始担心,评估结果之间的差异并非完全是由学生的学业成就差异所造成的,而是还受到了抽样误差的影响(即不同评估年度间或不同行政辖区间未被抽取到参加评估的群体不同)。由此,NAEP提出了全样本和扩大样本进行估计的方法,试图依据学生的背景数据以及学校数据等来虚拟未参加测试的学生的得分,从而修正差异。但是这种结果很难在“官方”报告中得以体现,至少到目前为止还未进入“官方”报告。(Karr2009)  

    上一页  [1] [2] [3] [4] [5] [6] [7] [8] [9] 下一页


    网友评论:(只显示最新10条。评论内容只代表网友观点,与本站立场无关!)
    姓名: E-mail:
    评分: 1分 2分 3分 4分 5分
    内容:
    验证码: