从学校教学的观点出发,我们可以把评价理解为确定学生的发展进步、达到教学目标程度的系统过程,需要采用测量和非测量的多元化方法去收集、分析和解释信息资料,并对其结果作出价值分析和判断。
在基础教育新课程实施过程中,教师既要掌握评价学生的多元化方法,也要重视改进考试命题方法,学会分析试卷,提高考试评价的科学性,从中获取有利于改进学习和教学的信息。
一
期末考试设计的基本要领
考试设计与课程标准、教材处理、教学要求之间具有连带关系,这里谈谈期末考试设计的几个基本要领。
考试设计要依据课程标准
学校期末考试,从性质上讲,属于终结性的标准参照测验类型。所谓标准参照测验是依据事先明确规定的知识、能力和素质的标准而制定,并据此标准可以对学生的测验成绩作出解释和评价的一类测验。新课程设计者采用一定形式,规定了各个学科不同学段(年级)的知识、能力和素质发展标准,各门课程的教材或学案则更加具体地组织建构、贯彻落实这些基本要求。
期末考试设计要依据课程标准,并依据课程标准提出的新理念,妥善处理教师对教科书的个性化教学处理和学生发展存在的个别差异和群体差异。
关注整体教育目标
考试既是古老的,又是现代的。中国人首先发明考试,也一再批评考试,而现在世界各国日益重视考试。这是因为人类的文明进程和许多游戏规则需要采用考试这一手段。然而,考试是一把双刃剑,利弊得失尽掌握在人的手中,关键还是我们如何科学合理地实施考试,尤其是基础教育新课程的实施,更需要我们与时俱进地改革考试。
其中之一,就是要把传统以知识立意为主的考试设计,转变为关注知识与能力、过程与方法、情感态度与价值观等整体教育目标的考试设计意境上来。老师们通过理解新课程的许多理念和要求,在考试设计中大胆创新,尽可能用一些新的题型、新的方法来考查学生的知识和能力,来记录和评价学生的思考历程和方法,来了解学生在完成某个学习任务时是否有过深刻的体验过程和反思,来分析学生在表达某些问题时是否有比较稳固的观念和价值取向。
鼓励学生大胆创新勇于创新并给予肯定
培养学生的创新精神和实践能力,这是素质教育的核心,但需要考试评价作出积极的导向。
在考试命题中考查学生的创新素质是可以做到的。比如,鼓励和允许学生在答题中对题目提出质疑;鼓励学生给出所谓问题的标准答案后再给出有创意的新答案。在题型方面,各个学科都可以命制考查发散性思维、表现创意和创新的题目。如语文科试题,可以通过写比喻句、给故事安排情节、给乱句重组、看图说话以及传统的命题作文等,考查学生的创意和独创性,培养学生的创新意识和习惯。再如数学科试题,可以鼓励学生一题多解或独特解法;可以用开放性试题让学生应用所学的知识去分析和探讨某个现实问题;还可以借鉴心理测量方法让学生用若干简单几何图形,尽可能地组合成有创意的不同物体的图形。
当然,在判定考试结果时,可以借鉴国外经验,对考试结果进行多维度的定性和定量相结合评价:一是传统意义上的分数或等级;二是学生的创意分或创新分;三是学生的努力程度评价或学习潜力发挥程度评价。我认为,许多发达国家和地区的考试命题改革经验可以为我们所借鉴,广大中小学老师可以大胆地探索和创新。
二
期末考试的测验蓝图设计
确定测验内容要目
测验内容要目,必须依据课程标准或教学大纲和学生的实际而定,但这并不意味着课程标准或教学大纲中设定的教学内容都可以成为测验内容。教学目标是通过教学效果来体现的,教学的良好效果,表现在教学内容给学生的增益上。若一项内容不能给学生任何增益,则说明该项内容没有什么教学效果。教学内容总体上总是会对学生产生增益的,但根据测验目标分解为若干内容点以后,未必所有内容点都会对学生产生增益,像有些可能在教学之前学生就已经达到规定目标的内容点等,就不应该再列入测验内容。
确定测验内容要目,有两种方法:一是按照教材章节或单元名称依次罗列;二是根据教学内容知识块分别罗列。譬如,英语课程内容可以分成语法、词汇、阅读、综合填充、听力、写作等几个知识块。
确定考试科目应考查的目标层次
确定某科目应考查的目标层次时,最好要从学科内容特点出发,以课程标准或教学大纲中确定的教学目标为依据,借鉴某种教育目标分类方法,有创造性地进行,以符合实际需要。
根据国内教学实际特点,学科测验中对考查目标的分类也可以有我们自己创立的方法。比如在考评学生对学科知识的掌握状态时,我们可以从以下四个层面加以把握:第一个层面是体现学科基础性的知识,这是学生应知、应会的内容层次,或者说是学生应当熟练掌握的那些基础知识与基本概念。第二层面是体现学科发展性的知识,这是师生双方需要通过一定努力才能在教与学的过程中得到落实的教学内容,是对学科的基础性知识起着发展与提高的内容层次。第三个层面是体现学科中一般性或苛刻性的知识,这些知识对后续课程内容的学习不是不可或缺的,只是对学有余力的学生提供一些高难度的或者是拓展知识面的要求。这三个层面的学科知识体现了共性要求到个别化要求的变化。第四个层面是学科知识的应用能力。只学不用或者只会学不会用,这不是我们现在所要求的教学与发展。
学科考试评价必须树立新的知识观和价值观,对知识的应用还可从三个水平来把握:一是知识的简单应用;二是知识的综合应用;三是知识的创造性应用。
合理确定各项权重
首先是确定各项测验内容要目下的权重。根据课程标准或教学大纲所规定的教学时间和分配比例,以及测验性质和其他因素,对列入测验范围的内容要目或内容点,赋以合适的相对比重即权重。该比重是测验试题数量、测验时间、分数分配的依据。
其次是把每一项考试内容的分数比重逐一分配到若干必要的测验目标层次中去,形成网格状的分数分配方案,即命题双向细目表。在对能力目标赋予相对比重时,除考虑学科特点之外,应强调高级目标的相对重要性,以促进学生高级智能的发展。
在实际工作中,有些时候我们也要将命题双向细目表加以适当改进、调整和扩展,从而能够包含更广泛的考查目标和特殊的学习成就。这种扩展有时也加入某些不能用纸笔测验加以评价的目标与学习成就,以提高学业成就测验的功效,体现更为全面和多元化的成就评价观。
三
试题编写的技巧与原则
在教学和考试过程中,教师沿用并创造了各种考试题目类型,这些大多可归于两类,一类是客观题,一类是主观题,它们各自又可以分成许多不同的题目类型。由于不同的题型具有不尽相同的测量功能与特点,要使学科试卷有效地测量到所计划的教学目标,就必须选择恰当的题型与之相配合。限于篇幅,这里仅对人们容易犯规的一些题型,谈论编写题目的基本要求。
编写试题的一般建议
国际著名教育评价专家布卢姆教授在他主编的《教育评价》一书中,提出有关试题编写与挑选的7条一般性建议,对我们很有启发和指导意义。这7条一般性建议是:试题应该清楚地提出一个单独而明确的问题;试题的阅读难度和语言难度应当适合考生的水平;所有试题均应该避免重复现象,并在无碍清晰度的条件下,尽可能地简洁;无论何时都要尽可能使用简明的单词——意义准确且清晰的单词;试题在语法和标点符号方面应该完美无缺;避免提供正确答案的线索;每一道试题都应予以编辑。
编写选择题的一般原则
根据我国学校实际,在编写选择题时(包括单项选择题和多项选择题),首先要考虑如下几条最基本的原则:
(1)试题的主干语本身有意义且能提出一个明确的问题。试题的主干语中不要滥用否定结构和双重否定结构。
(2)所有选项在逻辑上应与试题的主干语一致,而且错误选项在表面上应貌似合理。
(3)所有选项在长度上大体相等,避免把正确选项写得特别长或特别短为作答提供线索。
(4)用于测量评价高层次能力的试题应有新意,不能照抄书本中已经练习过的试题。避免使用包含难以理解且与测验目标无关的内容的试题。
(5)在选项中一般要避免使用“以上都对”或“以上都错”的选项。
(6)正确选项的位置应随机安排。试题之间不要互相提示答案。
(7)如果有更合适的题型来考查同一个问题的话,就不要勉强使用选择题。
编写填空题的基本原则
编写填空题首先要考虑如下几条最基本的原则:
(1)试题要着眼于考查重要的、关键的知识,不考无关紧要和稀奇古怪的内容。
(2)填空题答案应当简洁、明确,抓住句子内容的关键点。
(3)有比较公认的答案,否则就改用其他更加合适的题型。
(4)空格的线段长度应与答案内容大体相当,太长或太短往往会引起误会。
(5)尽量把填空题的空格留在句子的后面或中间,不要一开头就是空格。
(6)除非默写回忆形式的填空,一般填空题答案以一个或两个为原则,空格不能太多,以避免句子支离破碎,影响学生理解题意。
编写是非判断题的基本原则
是非判断题通常用于测量被试对基本概念、性质、原理、原则的认识和判断区别事实与观点、认识事物因果关系,以及一些简单的逻辑关系推理的能力。或许有人认为是非题最容易编制,其实并非如此。因为此类试题要求被试作绝对正误的判断,所以每一个叙述必须绝对正确或完全错误。为确保绝对正确或完全错误,就需要在设计是非判断题时遵循以下几点原则:
(1)试题内容应是重要的知识,而不是无关紧要、细枝末节的内容。
(2)试题应多是测量理解能力,不要直接抄录教科书中的句子。
(3)试题应做到用词准确,避免模棱两可的语句。
(4)试题陈述应简单明了,应尽量采用正面叙述,避免使用复杂的句子结构,避免双重否定的语句,以减少学生的阅读困难。
(5)确保每道试题的叙述必须绝对正确或完全错误。
(6)正句和误句的排列要随机化,数量应大致相等。
编写论述题的基本原则
论述题是最常用的一种主观性题目类型。典型的论述题就是向学生提出问题,要求学生用语言文字提供一份较长答案。这种试题的最大特点是学生在回答问题时有较大的自由度,学生可以充分地运用所学的知识来分析问题和回答问题,学生可以有自己独特的见解。因此论述题能够较好地测量与评价学生的统整、组织、归纳、分析、综合、探究、写作、论证等方面的能力。为保证论述题的质量,在编写论述题时要遵循以下原则:
(1)试题应该用来测量较高层次的教学目标,如要求学生提出理由、解释变量间的关系、描述与评价材料、有系统地陈述结论等。
(2)在命题时,我们必须对学生提出明确的任务,使每道题都能真实地反映学生实际能力,而不受阅读、理解等其他因素的干扰。
(3)必要时可以出多道论述题让学生自由选择其中的某些问题或所有问题进行作答,计算成绩时则应该挑选回答最好的那几道题目,而不是相反。考试评价要体现人性化和个性化的理念。
四
试卷分析的基本内容和技巧
考试的教育测量学质量特性分析
(1)考试效度分析。它是考试有效性程度的分析,关心考试在多大程度上测评到我们所欲测评的目标。就学校举行的期末考试来讲,考试效度分析,特别关心的是考试题目设计和抽样在多大程度上代表本门课程这个学期的教学内容和要求。这个可以通过试卷题目的分类研究,作出判断。
(2)考试信度分析。它是针对考试结果有多大的可信程度进行分析。考试信度越高,说明考试的结果越可信,考试成绩越能代表学生个人的真实水平,考试分数的误差越小。考试信度分析有些专门的方法和公式,读者可以参看有关专业书籍。
(3)试题编写优良性分析。它主要是依据试题编写要领和原则进行逐题分析,对试题设计技巧性、测量目标的妥切性、设置问题情境的创意等方面作出分析判断。
(4)试题的参数指标。它主要包括试题的难度分析和试题的鉴别度分析。试题的难度指标可用试题的通过率或得分率来刻画,它反映学生掌握某项知识与技能的圆满程度,也可以从一个侧面反映教师在这项知识与技能上的教学效果。试题的鉴别度分析,实际上也可以认为是试题的效度分析,这个指标关心的是试题能否对鉴别学生的知识掌握状态和学习能力高低作出贡献。
考试结果的教育统计学分析
考试成绩的教育统计学分析,主要包括对考试成绩的分布状态进行统计分析以及进一步对群体差异进行研究。常见的是分数段统计与描述、各个等级分数的统计与描述、及格率的统计与描述、优秀率的统计与描述等内容。对群体差异进行研究,则是采用更进一步的统计技术,对不同教学处理下的群体做成绩的差异性研究。
考试结果的教育学分析
考试结果的教育学分析,就是通过详细研究每一个学生的试卷,对学生的考试结果进行个别化的教育学分析和评价。这是一个从一般到个别、再从个别到一般的分析过程。概括地讲,主要有如下几个方面:
(1)分类比较研究与个别化评价。为了对学生的学习作出客观性和具体的评价,需要研究学生的个别差异。按照从一般到个别的思路,对考卷按照分数段或者成绩等级进行分类,加以比较研究。显然,教育学理论和实际教育经验都告诉我们,同样的分数并不意味着同样的发展,同样的等级分并不意味着有同样的答题结构和答题思路。因此,通过比较研究同类试卷中各个学生的答题情况,发现学生答题的个性特点和问题,探测与发现学生的特殊才能与天赋,就能够对学生进行个别化的评价和指导。
(2)学习困难学生的诊断分析。学生学习困难,就好像身体患病,需要看医生,诊断疾病后再处方治疗。老师应就地取材给患有“学习困难病”的学生,作出诊断并采取教育补救措施。其中方法之一就是分析与研究学生的试卷,看看学生怎么思考、怎么推理、怎么分析、怎么叙述、怎么选择、怎么导出错误,从而找到学生可能的学习困难所在和可能的先决知识缺陷,并通过与学生面谈来验证原先的判断,尔后采取必要的教育补救措施。有选择地研究那些学习特别困难且需要帮助的学生的试卷,结合平时观察和测验判断,对学生进行因材施教,这是教师的责任,也是最有人文关怀的教育方法。
(3)教学诊断分析。一般说来,中小学期末考试,通常是由一定范围内的学校群体或教师群体联合举行的终结性测验,试卷的编制相对来讲更具有权威性和“标准性”。因此,通过考试分析,对学生的学习水平和老师的教学水平可以作出某个侧面的评价。更为重要的是,课任教师通过分析所教学生的答卷,尤其是分析选择题的各种选项比例,有可能发现在一定范围内共同存在的学习错误问题和教学薄弱的方面,对教学存在的问题作出诊断分析,提出改进教学或教学补救的方案。这是教师提高教学能力、促进教师专业自主发展的一种有效措施之一。
总之,期末考试命题制卷和考试分析,是一项比较专业的工作,需要老师们付出许多艰辛的劳动,也需要老师们不断学习,提高教师的专业化水平。
(摘自《福建教育》)
作者简介:黄光扬,男,福建师范大学教育学院教授,福建师范大学教育科学研究所所长,中国教育学会统计与测量分会常务理事。曾任国家教育部考试中心兼职研究员、国家教育考试网上阅卷标准制定测量专家顾问组成员、福建师范大学本科教学评评估建设办公室常务副主任。
声明:本文内容整理自网络,如有侵权,请联系删除。
获取更多精彩
扫描图中二维码关注我