教科处

新课程

部门主页 >>教科处 >>新课程

质性课程评价:从理论到实践

来源:汪纪苗|编辑日期:2007-02-14 22:47:49|点击数: |发布:33

李雁冰
一、世界课程评价的历史发展
课程评价是一个既古老又年轻的领域。说它古老,是因为较正规的课程评价的渊源可追溯到我国隋朝即已出现的科举考试,距今已有1400多年的历史;说它年轻,是因为从教育自身发展着眼的系统评价活动,是于19世纪末才出现于美国,距今刚满100年。1897~1898年,美国学者莱斯(T.M.Rice)曾对3万多名小学生进行拼字测验,以检验拼字教学时间对学习效果的影响,评价界一般以此作为评价研究的开端。在短短的百年时间内,课程评价的理念几经变换,评价思想不断更新。对此,不同的学者根据各自的标准进行了不同的划分,提出了不同的见解。
以色列著名教育学家、课程论专家利维(A.Lewy)对教育评价的历史进行了大跨度的审视,将其划分为三个时期。(1)古典的考试型时期(examination pattern):教师主要以口头提问的形式检查学生是否已理解所学知识并记住一些重要部分。如西方中世纪时期的宗教教育以及我国传统的私塾教学中,使用的多是这种考试类型。(2)心理测量占统治地位的时期:它始于第一次世界大战后的20年代,是科学管理效率测量工具在学校成绩测验中的应用,形式大多是多项选择的纸笔测验,这种测验形式直到80年代未,仍在学业成就评价中发挥着极大作用。(3)后现代时期(postmodernera):它兴起于80年代以后,其最大特征有二:一是增加了教师在评价领域中的权威(相对于由教育外部人员承担的“专业评价”),二是对某些心理测量原则的适切性提出质疑,并以开放性的结论以及“评定”(assessment)这一概念代替以前的“评价”(evaluation)。利维指出,评定,是80年代以来流行于评价领域的术语,维根斯(G.P.Wiggins)曾从词源学的角度分析过这个词:它的词根是拉丁动词“assidere”,意即作为评价者的教师“坐在考生旁边”。按照维根斯的解释,这个词暗含着这样的意义:评价者由教师来担当,但他的行为不仅是评价者,而且是为了学生的利益并支持学生。
美国评价专家古巴和林肯(E.G.Guba & Y.S.Lincoln)对评价领域的划分以及对该领域的批判,深刻地把握了评价发展的内蕴。这里,我们试以他门的划分和批判为线索,探究评价理念的发展与变化。
(一)测验和测量时期
这是第一代评价时期,它盛行于19世纪末至20纪30年代。这代评价认为,评价在本质上是以测验(testing)或测量(measurement)的方式,测定学生对知识的记忆状况或某项特质。20世纪初,随着自然科学的发展,各种统计、测量技术得到长足发展,一批教育、心理学家开始把这些技术运用于教育领域,如英国遗传学家、心理学家高尔顿的《英国科学家:他们的秉赋与教养》、法国的“比奈—西蒙智力量表”、德国冯特的实验心理研究成果和美国桑戴克的《心理及社会测量理论》都相继问世,各种智力的、学业成就的、人格的测验工具也随之涌现。这一切都为评价的正规化、系统化创造了条件。同时,“一战”后发展到顶点的工商业的“科学管理运动”,也对学校教育发生了深刻影响:“学校被视为工厂”、“学生被视为原料和产品”、“教师成为加工者”。学生产品是否符合需要、教师教学有何成效、学校教育是否成功,似乎都可以通过“测量”来检验,这显然为评价的发展提供了客观的社会需要。评价由此而得以兴盛。
第一代评价的基本特点是:认为评价就是测量,评价者的工作就是测量技术员的工作──选择测量工具、组织测量、提供测量数据。因此,这一时期也被称为“测验”和“测量”的时期。
(二)描述时期
第二代评价是20世纪30年代随“八年研究”而兴起,一直持续到50年代。这代评价认为,评价在本质上是“描述”(description)──描述教育结果与教育目标相一致的程度。30年代,美国完成初等教育的人数激增,但经济大萧条又使大批青年找不到工作而无处可去,只好到中学注册学习。中学教育因而急剧膨胀,原有的中等教育目标、课程、评价标准都受到前所未有的挑战。由进步教育协会主持的“八年研究”,就是试图面对这些挑战,回答如下问题:中学除了学术性课程是否还应增加其他课程、从而适应那些完成中等教育后并不打算进一步接受高等教育的学生的需要?增加了其他课程是否会降低教育质量进而影响高等教育的质量?等等。作为一项课程实验,“八年研究”无疑是成功的,泰勒对此曾有过全面的论述。此外,它还特别推动了课程评价领域的发展,“以前,如果对教育计划或程序的结果进行客观评估,是根据学生在成绩测验中的表现作出判断,而成绩测验通常是测量简单的技能和对信息的回忆,并用一个分数概括地报告结果。八年研究提醒教育者,教师在一项课程实施中通常要求几项教育目标。研究还表明,通过使用问卷、观察、产品样本和测验,都可以评估学生的每个主要目标上的进展情况。这已成了一项普遍的评价观。”作为“八年研究”的评价组主任,泰勒曾指出,评价应该是一个过程,而不仅仅是一二个测验。评价过程中不仅要报告学生的成绩,更要描述教育结果与教育目标的一致程度,从而发现问题,改进课程教材和教育教学方案方法。在泰勒的影响下,一时间美英等国出现了诸多针对评价而设计的教育目标体系,其中以泰勒亲自参与并指导的布卢姆的教育目标分类学影响最为深广。布卢姆等人明确提出,制定教育目标是为了便于客观地评价,而不是表述理想的愿望,事实上,只有具体的、外显的行为目标才是可测量的,布卢姆等人曾以公式来表示,就是“目标=行为=评价技术=测验问题”。由此,泰勒原理与布卢姆的教育目标分类学一起广为传播,成为一项国际性的普及。
泰勒的成就和观点影响了整整一代人,在评价领域产生了巨大影响,形成了一个以“描述”为标志的评价时代。教育评价专家克龙巴赫(L.J.Cronbach)写到:“1935年以前,对学生的考察基本上都是依据事实性知识和掌握基本技能的情况。是泰勒在这一时期的研究和论述,才使人们意识到:通过简单的事实测验不能引发高级心理过程;促进事实性知识的教学,并不可能促进──事实上可能干扰──其他重要的教育目标。”也正是在泰勒的努力下,“评价”(evaluation)一词取代了“考试”(examining)和“测验”(testing)两个术语,使评价领域有了一种新的指导思想。
总之,第二代评价的基本特点是:认为评价过程是将教育结果与预定教育目标相对照的过程,是根据预定教育目标对教育结果进行客观描述的过程;评价的关键是确定清晰的、可操作的行为目标;评价不等于“考试”和“测验”,尽管“考试”“测验”可以成为评价的一部分。第二代评价和第一代评价相比,使评价走上了科学化的历程。
(三)判断时期
判断时期属于第三代评价,它萌生于1957年以后美国因苏联卫星上天而发动的教育改革,持续到70年代。这代评价认为评价在本质上是“判断”(judgement)。在这一时期,评价人员开始关心一个问题,即对已经确定的目标,是否需要评价、是否需要价值判断?由此延伸开去,评价专家又激烈地讨论了判断是否应成为评价的一项基本活动?判断是否需要标准?如果需要标准,能否建立科学、客观的“价值中立”的标准?这个时期的代表人物有艾斯纳、斯克瑞文、斯太克(R.E.Stake)等人。如艾斯纳认为,“凡是内容、活动、目标、顺序或呈现方式、反应方式,都必须考虑各种抉择,评价各种计划的用途……评价就是要对某些计划方案的优劣进行价值评估。评价的主要问题,在于挑选时的集中点、复杂性和综合性。”斯克瑞文也认为评价是一种方法上的活动,它是根据一组加权(weighted)的目标标准,收集和综合有关的现象资料,以形成比较的或价值的判断,并说明资料收集方式、加权数和目标选择的合理程度。斯太克则把评价看作是既有描述又有判断的活动。他们还提出了反映各自价值取向的评价模式。
第三代评价的基本特点是:把评价视为价值判断的过程,评价不只是根据预定目标对结果的描述,预定目标本身也需要进行价值判断;既然目标并非评价的固定不变的铁的标准,那么评价就应当走出预定目标的限制,过程本身的价值也应当是评价的有机构成。这样看来,第三代评价是对第二代评价的重要超越,它走出了第二代评价“价值中立性”的误区,确认了价值判断是评价的本质,确认了评价的过程性。许多新的评价理念如“形成性评价”、“目标游离评价”、“内在评价”等在这一阶段产生。
(四)建构时期
建构时期的到来,是与质性评价范式的应用联系在一起的。60年代未、70年代初,随着对课程改革运动的深刻反省,传统的评价方式也受到猛烈的冲击,人们渴望发展评价的新理论和新范式。1972年11月,在英国剑桥大学的邱吉尔学院(ChurchillCollege),十四位学者会聚一堂,讨论评价理论和范式的创新问题,以代替传统占统治地位的目标模式。会议认为,传统的评价范式,源于教育研究中一直占优势的实验或心理测量传统。这种评价范式适用范围狭窄,不能解决评价中所遭遇的复杂问题。因此,会议建议采用新的、文化人类学的研究范式取代旧有范式,即评价不是对预期的教育结果进行测量与模式,而是要对整个方案,包括前提假设、理论推演、实施效果以及困难问题等等,进行全面而深入的研究。质性研究范式由此推广开来,并开创了一代新的评价理念,即古巴和林肯的所谓第四代评价。
1.对前三代评价的批判及其启示
前述三代评价,尽管每一代评价理论都力图克服上一代的缺陷,并使之更加符合时代对评价的新要求,但总起来看,它们还存在着严重的缺陷和问题。吉

上一篇:

下一篇: