理想与现实的悖反：美国基础教育学业标准化测评体系评析-免费复制免费下载-参文网

　 20世纪80年代，美国联邦政府为了提升基础教育质量，建立了以标准化高利害测评为核心的学业问责制度，并在2002年的《不让一个孩子掉队法》(简称NCLB)中将标准化测评推向教育改革的顶峰，其期望通过标准化的学业成就测评标准和进步指标对各学校、学区予以奖惩问责，以实现由教育机会均等逐渐迈向学业成就公平。随后的奥巴马政府在NCLB核心理念不变的基础上继续完善学业问责制度的教育实践，进一步明确了其固有的构成要素与措施，包括设立具有挑战性的问责评价目标和标准、开发科学的学业成就评估模型、公开全面详实的问责报告以及根据评估结果对相关对象实施有效的奖惩或改造等。[1]诚然，有效的问责设计应是基于标准和数据的，没有可靠的数据以及相应合理的标准，问责评估就无法做到公正与公平，更不可能促进学校教育的改革发展。然而，在追求学业问责制度设计的科学性与有效性理念下，美国各州渐趋一致的高标准、多元化考试测评实践并未收获其期许的教育质量提升，甚或教育的实质公平。一、加剧不公：学业标准化测评的现实结局美国学业标准化测评体系虽然期望通过统一的学术标准、公正的考试程序、科学的数据分析等合法的实施设计来有效促进各州、学区和学校的教育质量平等的问责，但实践效果却是与促进教育平等的目标背道而驰。 (一)学业标准化测评的不平等后果美国一直以来对于不同种族、阶层实施的是“熔炉式”的多元文化教育，强调教育内容与方法的个体差异，但标准化考试问责制度要求不同文化背景的学生以统一的核心课程考试决定人生的成败，且该制度的考试设计者都是来自于社会上层阶级的“学科精英”，他们从社会主流文化角度设计的考试，忽视了学生在种族、文化、经济、资源、认知等各个方面的背景差异。这种以中上阶层学生情况为基础而确立的教学内容、方法和评价标准，导致了少数族裔、低收入家庭等不利地位学生符合考试标准的比例明显低于白人学生。同时，为公平而将学生成绩按种族或背景进行归类，相反给这些学生打上了“差生”的标签，并将其推向辍学的边缘。以学生分数对学校、教师进行分级和奖惩，使许多学校为了避免被鉴定为“落后”，不得不舍弃成绩落后的学生来换取形式上的进步。学校整体分数的提升、白人与少数族裔学生“学业鸿沟”的缩小，这些形式上、表面上看到的公平，背后是大量少数族裔学生的辍学换来的。[2]以“选拔”为导向的统一标准化考试给学生们带来的不是期望的公平，而是弱势群体被无情的淘汰。[3] (二)教育不平等现状的原因分析标准化测评问责制度追求教育公平的理想设计在法律上实现了学生形式的平等，却造成了事实的不平等，这在实践中主要体现在教育资源配置不平等、教育过程文化不平等、受教育对象经济不平等这几方面。首先，教育资源配置方面，标准化的学业测评体系虽然提供了公正的测评过程和精密的评估模型，其最终只是测评了考生对某项技能或知识的掌握情况，却并未考虑不同学生是否拥有均等的机会去接受同等的教育对待。由于贫富学区教育经费的巨大差距而导致包括师资水平和硬件资源等教育资源配置不均等是贫富学区学生无法获得相同测评结果的根本原因。而以“惩罚落后、奖励进步”为基调的标准化测评问责在缺乏对贫困学区资源配置充分倾斜的实践中，反而恶化了落后学区的教育处境。由于贫富学区在不同教育资源配置下被设立了同样“平等”的测评标准，导致许多落后学区不得不“为考而教”，产生“应试教育”相关各类问题。其次，在教育文化方面，尽管美国政府一直奉行多元文化政策，试图通过文化的平等、理解与共融取代过去“文化熔炉”的形象，各学区、学校、教师都会尽量根据不同文化背景学生的认知特点去设计教学和建构对话。多项研究表明，只有在教学中保持对学生(尤其是少数族裔学生)的习俗、语言等文化要素足够的敏感性和包容性，才能诊断其学习需要并发挥其学习潜能，这才是实质且充分的教育公平。[4]然而，标准化测评问责制度的实施使教学过程中的关注学生需求个性转为注重测评科目共性。最后，在学生经济背景方面，由于测评试题都是以社会主流的中上层文化作为背景和标准进行编制的，这使得家庭经济地位高的学生在高利害测评中占据优势地位。相反，家庭贫困的学生在教育资源配置和测试中都处于不利地位，往往会被包含了表现性测试的“全面的”、“多方位的”公平测评考试所淘汰，致使教育变成社会不平等延续的代际工具。二、走向均衡：理想与现实博弈的理性思考教育标准化测评问责制度理论设计与现实结局的相悖从根本上体现的是美国基础教育改革在国家理念与市场逻辑的分歧。正如美国政府在新自由主义与新保守主义两大思潮中的不同公平取向：一种是以哈耶克观点为首的坚持程序正义的机会公平论，即政府应也只应确保市场过程自身的合法性才是公正的；另一种则是以罗尔斯观点为代表的社会正义的结果公平论，即政府应通过补偿弱势群体来弥补因历史或其他原因造成的社会不平等。[5]为此，对起始状况不平等的人予以同样的对待和测评，其测评手段和过程越是公正和科学，结果越是加剧社会的不平等。教育测评体系虽然关注了标准、程序、模式的科学与统一，但这仅仅是推动了程序正义的机会公平，而薄弱学区、学校、学生却因初始不平等且未得到充分的教育资源补偿造成了不平等结局。从社会系统的整体视角对美国基础教育标准化测评进行理性思考将有助于理解我国高考改革的现状与未来。 (一)社会分层与控制：高利害教育测评体系的社会合理性观照教育是一种社会性的存在。教育的问题既是教育系统内部的问题，更是社会整体的问题。社会分层指代一种被制度化的社会资源的配置不平等系统，它无论是在发展中国家或发达国家都普遍客观存在。因此，在教育领域，学生个体间的差异性是客观且自然存在的，但是由于基于不同评价标准的评价造成了学生间、学校间、学区间的在进行资源配置时出现不平等，且这种不平等因为这种评价制度的不断精细化完善而制度化，最终固化为社会分层。而评价话语权力的归属与评价标准的设定则体现了国家当前的社会价值取向，即决定了教育是体现中上层社会阶层利益而对当前社会不平等结构进行固话，或是体现底层社会阶层意志而促进社会阶层流动。因此，美国NCLB法案推动下的高利害标准化测评问责导致“为考而教”、追求“年度进步目标达标率”等现象出现，是学校、家长、学生在政府设置的“社会流动”这一游戏规则下做出的必然教育选择。在我国，因高考采取能为社会各阶层提供一个共同获取高等教育机会的测试标准，使农业人口看到了二元超越的希望，政府尽管一直为解决高考带来的“应试教育”问题而提出过“取消考试”、“减负”等政策，但始终成效甚微。从这个角度看，在当前城乡二元经济结构背景下，我国以笔试为主的高考恰恰因为其各种“应试漏洞和诟病”使社会分层无法得以完全固化，而为广大贫困地区人口的跨阶层流动留下可能。 (二)精英主义与顶线评价：基础教育标准化测评体系的主要批判无论是美国NCLB法案或是中国高考带来的应试教育后果虽在优质资源稀缺性等现实客观背景下存在一定的社会合理性，但不可否认的是，以精英主义教育价值观主导的高利害考试测评不应该出现在基础教育，尤其是作为国家准公共产品的义务教育阶段。所谓精英主义教育是指教育活动的主要甚至唯一目的是培养和选拔精英人才，而这种人才是对以学科专业人才为主体的所有高级人才的总称。该理念假设受教育者潜力有“三六九等”之别，现实依据是精英人才主导社会发展，以学科化、专业化标准对受教育者进行选拔和培养。[6]这种教育观念下的测评不再指向人的基础发展，而是精英的培养和选拔，其通常都会采用一种选拔性的顶线测评而非合格性的底线测评。对于教育测评来说，在国民素质建构与发展的教育系统中，基础教育是教育系统的第一层次，而专业教育、职业教育则是第二层次。基础教育测评保持教育的第一层次合格目标，这是它的底线，而追求教育第二层次的选拔目标，则是它的顶线。前者是以全体学生的、全面的、基础的公民素质培养的测评，而后者则是关注部分学生的、非全面的、考试竞争成绩的测评。[7]为此，美国政府在NCLB中提出的“让所有学生能在2014年之前达到各州设立的学业成就熟练标准”目标，表面上看是以提升每位学生的学业成就以及缩小不同族裔学生间学业差距的合格性测评，其实质却是以精英培养标准对部分“核心”素质和部分落后学生实施的竞争性测评，企图通过高利害问责促使每位学生都成为国家设定的“世界精英”，其结局只能是NCLB实施以来约71％学区减少历史、音乐等非测评课程的教学时间，以及大量填鸭式教学、流水线作业工厂现象的出现。[8]基础教育的顶线评价会造成越陷越深的教育困境，当教育越是走向高层次，实施顶线评价的基础教育就会产生越深的矛盾。一方面，基础教育顶线评价会混淆基础教育与高等教育的性质与使命的差异，即基础教育作为由政府履行组织和供给职能的准公共产品，应具有不同于其他层次教育的公益性，且必须遵循均等机会对差别原则的优先性原则。[9]否则，基础教育顶线评价会造成精英与平民的阶层对立，使公共教育成为文化、政治、经济等领域中的资本代际工具。另一方面，由于“统一且平等”的标准设定中必然附加了利益阶层诉求和国家政府意志，基础教育顶线评价通常会极大抑制儿童的自然成长与个性需求，使许多其他标准测评下的“人才”丧失潜在发展的可能性。 (三)走向生存与发展：均衡理念下基础教育测评体系的发展取向均衡并不等同于公平或平等，它是一个更为动态和强调过程的概念。教育均衡强调的是“满足所有人最基本的学习需要”以及“提供每一个人所应得到的”，而非绝对的平均和相等。均衡观念下基础教育测评体系的发展应走向生存型评价和发展型评价。一方面，基础教育测评取向应是大众主义教育价值观的底线评价。底线评价是一种走向大众化的评价，它以生存意义绝非选拔意义的基础教育作为价值前提。生存型的基础教育意味着每个人都应具备良好的适应现代生活的公民素质，而这些人都在时空宽泛意义上享有同等机会成长为精英。因此，这种生存型测评目标是指向全体而非部分学生的发展，强调学生整体素养的形成，淡化学科化、专业化的训练；测评程度是普遍可及的和合适的，也就是学习者在基本的教育资源配置下通过适当努力可以实现的；测评性质是一种公民基本品质的合格性评价、基础性评价、发展性评价。为此，美国从2005年底开始大力推广评估增长模型，在2014年启用共同核心州立标准的复合型模型都表明了联邦政府对评估的内在含义：并不是要求所有学生达到一样的学业水平，而是达到国家规定的较高的基本标准后，在这“共同基石”上发展学生的个性和差异，从而提升整体兼顾缩小差距。[10]另一方面，基础教育测评取向应是教育均衡理念的发展性测评。教育均衡发展不是“削高就低的限制发展”，更不是让所有地区或学校发展成同一水平和同一模式，而是在基本平等的办学条件下，比较公平的竞争环境中，鼓励不同地区或学校追求特色发展，全面提高教育质量。而“发展”的基本前提则首先是对地区间、学校间、学生间在教育资源、水平、天赋以及未来的发展方向等方面差异性的认同与尊重。因此，在设立测评目标的时候，不能只关注教育的物质性和结果性目标，而忽视了功能性和过程性目标。即基础教育测评的目标是促进学生的整体能力、素质的全面提升与发展，这就要求测评指标不能一味强调学科或素质的全面性而忽视个体学习的可持续性和发展性。这样，基础教育测评在关注测评标准与课程标准的水平一致性的同时，更应重视测评标准与高层次教育衔接和发展的垂直一致性，从而保障每位学生能在基础教育阶段为未来成就做好准备。

相关推荐：