新教育质量观冲击决策者_决策者如何提高决策质量?

  教育部基础教育质量监测中心2007年11月成立之时,曾引发多家媒体关注。人们以为会引发大动静的“国家教育质量监测”,5年内一直静悄悄的。记者每次遇到中心副主任胡平平,她总是微笑着婉拒采访。今年8月,神秘感终于消失了。她热情而慷慨地邀请记者前去中心坐坐。在简陋的二层小楼里,我们开始了一场关于“教育质量”的探讨。
  从学业成绩走向全方位的大质量观
  记者:“教育质量”一直是这几年的热门词汇,“提高教育质量”也已经成为我们国家下一个十年教育改革发展的核心任务,你们做质量监测,是怎么来定位“教育质量”的?“教育质量”到底指什么呢?
  胡平平:自古到今,我们国家老百姓基本上是以分数来定的,也就是学科成绩。而现在人们越来越关注的是中考和高考,也就是升学率,社会上似乎都用这个来评价学校,评价地区。
  记者:其实这个并不等同于教育质量。
  胡平平:对。上至教育行政官员、专家学者,下至学生、家长,对“什么是好的教育”或“什么样的学校是好学校”心里都持有某种标准,但其中的分数、升学率又是大家公认的,大家认为这个标准比较实,其他的则比较虚。从理念上来看,我们国家已经有那么多文件,那么多理论,说得很清楚了,教育质量是指学生德智体美的全面发展,这涉及人未来全面发展所需要的素质和素养。
  记者:每一个人的全面发展,这个提法还是比较抽象的。要变成学校教育的话,中间还缺少很多东西。
  胡平平:所以,学业质量只是全面质量观的一方面,绝对不代表教育质量的全部。
  对于教育质量的内涵,理论上大家都可以讲清楚,一旦细化,观点就不一致了,即使在专家研讨会上也是仁者见仁,智者见智。但有一点可以肯定,大家都认为,学科成绩只是质量的一部分,不是质量的全部。我认为,教育质量,从学生来讲,除学业水平外,也应包括情感、态度、价值观,包括学习的能力、学习的情感、学习的兴趣,包括后续发展的各种动力和潜能;从外部来讲,对一个区域群体教育质量的考量还应包括教育行政部门、学校为孩子的发展提供了什么条件、动力和机会,其中就包括课程资源,课程资源又包括师资的条件,包括教育教学课程的开设,还包括各种投入。
  记者:那么你们做质量监测,主要是选择哪些维度来进行观察的呢?
  胡平平:有六个方面:学生的思想品德和公民素养、学生的身体和心理健康水平、学生的学业水平和学习素养、学生的艺术素养、学生的实践能力和创新意识、影响学生发展的教育环境与社会环境。通俗地讲,从大的方面来说,一个是人的素质,也就是前五个方面;一个是教育的投入,它包括影响学生发展的教育环境与社会环境。对人的素质评价,绝对不能像现在一些人那样,仅仅用升学考试科目成绩来评价。有的学校在升学率标准的引领下,有些课就不开;学生为了考学,有些课就不上。而质量监测则是全方位地测,监测内容体现党的教育方针,体现国家的意志,这也是一个实实在在的引导。
  记者:这个“德”怎么测?
  胡平平:主要是对基础教育阶段的学生在自尊、自强、遵纪守法、诚实守信、保护环境、积极参加公益活动、具有社会责任感等思想品德和公民素养方面进行监测。“德”包括价值观。我们也有测试的量表,因为是纸笔测验,我们没办法测他的行为,只能从他的认识、理解上来测,也能测出真实的东西,比如说对国家的认同感,对集体的认同感。而且,我们测量的过程是非常严格的,跟学生个人的利害不挂钩,所以一般能测出真实的东西来。
  记者:教育投入主要是指什么?
  胡平平:教育投入关系到教育的环境。它分两类,一类是客观的投入,主要是物质的投入;还有一类是学生的时间的投入和精力的投入。
  记者:为什么要这么关心教育投入?教育投入与人的培养有什么关系吗?
  胡平平:国际大型监测的结果和我国5年的试点监测结果均显示,教育经费、师资、仪器设备与教育质量有着明显的正相关,也就是说,教育投入越充足,教育质量也就能越好。要提高教育质量,政府就应保证有基本的投入。
  教育投入与人的培养的关系,可以从四个方面来解释。一是教育资源有没有的问题,例如,国家要求小学三年级开设外语课,可是不少中西部农村学校没有外语教师,那么外语的教学质量就无从谈起。二是关系到区域教育资源使用效率。如果教育资源水平还不错,但与你的教育水平不成一定的正相关,那该区域的投入效率就不高。三是关系到教育公平,如果学校与学校之间学业成绩差别特别大,说明你这个地区生源、师资、教育资源配置可能是不均衡的,区域教育的整体效率并不好。教育质量监测除了关心整个区域学生群体的素质,还关心学校与学校之间的差异大小,也就是教育公平问题。这也是我们考量区域教育质量的一个重要因素。四是关系到个体教育投入与产出的效率,也就是学业负担问题。我们俩成绩差不多,你的负担很重,我的负担很轻,说明你的效率不高。过重的负担甚至还会带来身心发展的诸多问题。国际大型监测的结果和我国5年的试点监测结果也显示,投入过多的学习时间与学习成绩并没有明显的正相关。所以质量监测除了看校与校之间的质量差异以外,还要看学生的负担状况,从而知道自己的问题在哪里,知道要提高学习效率,需要提高学生的学习兴趣,需要培养学生的良好学习习惯,还必须减轻学生过重的学习负担。
  记者:我觉得这就是一种系统的质量观,而不只是看结果的质量观。
  胡平平:应该说是一种全方位的大质量观。
  “我们会比较关注过程”
  记者:我们很关心你们的监测结果是怎么去描述的?
  胡平平:我们会从学生学业水平表现、学生学习情感和学习时间投入、学生身心健康状况、课程开设和教学资源等多方位去描述,让被测者知道自己的优势和劣势,以便其发扬、改进和提高。例如,在我们的监测当中有一个对区域群体的综合判断,这个判断有9种类型,我们追求的区域教育质量应该是“高质”、“均衡”、“低负”。其中,“均衡”指的是校与校之间质量的差异较小。除了这个“高质”、“均衡”、“低负”以外,还有其他8种类型,比如说“高质”、“不均衡”、“负担重”,或者“均衡”、“负担轻”、“质量低”,这些都不是我们所追求的。我们会给一个区域做一个基本的判断:你的学业水平是一个什么状况,你的校与校之间的均衡是一个什么状况,你的学生负担是个什么状况,还包括学生的主观感受:我感到疲惫吗?我感到厌学吗?这些涉及到他将来可不可以持续发展。监测结果就相当于一个体检报告,只交给被测的样本地区。   记者:那你们怎么选择参照系?
  胡平平:有的是用国家的明文规定,有的是用国外的参照系数进行比较。刚才谈的这个基本判断也是比较而言的,什么是“高质量”,什么是“轻负担”,什么是“均衡”,我们目前还没有定一个绝对的标准,一般是在我们的样本地区进行比较。
  也就是说,过去说起教育质量。我们会直接关注学业成绩,现在我们会比较关注过程,也就是你是在什么环境中通过什么方式得到这个学业结果的。
  记者:你们是通过什么方式来关注过程的?
  胡平平:一般是两种方式,一种是用学科的工具进行测试,也就是试题,但这个试题不是选拔性的,而是水平性的。它的参照系就是课程标准。我们把课程标准的要求分成四类:水平I、水平Ⅱ、水平Ⅲ、水平Ⅳ。水平I意味着没有达到课程标准的要求,水平Ⅱ、水平Ⅲ、水平Ⅳ都表示达到,级别越高表示水平越好。通过监测,我们可以看到,在一个区域内,有多少孩子达到了课程标准的要求,有多少孩子没有达到。过几年我们再来测,通过一定的技术还可以做纵向比较,水平Ⅱ以上的学生比例数提高了多少。这和传统的考试还不一样,传统的考试是没有办法进行前后对比的。
  第二种就是问卷调查。问卷调查包括孩子对学习的感受,情感、态度、价值观,这些是孩子自己填的,另外还有教师、校长的问卷。这些问卷用了很多国际通用的量表,它们都是可以进行比较的。
  经过试卷和问卷的数据链接我们发现,师生关系好的,这个群体的孩子成绩肯定好;学习兴趣高的孩子学习成绩好;抑郁倾向的检出率低的,成绩肯定好;有网络成瘾倾向的,肯定比没有的成绩要低。这样我们就可以把很多相关的因素理清了。但是很难去归因,比如,虽然师生关系与学业成绩之间高度相关,但不能说因为师生关系好,所以学业成绩好,因为还有很多其他的因素在起作用,只能说二者正相关,这样也可给大家提供参考。
  定位于常态水平监测
  记者:您觉得这种监测可准备吗?
  胡平平:准备没有用也没有必要。各省(自治区、直辖市)在正式监测前并不会过早知道专家抽了哪个区县,更不知道抽到哪个学校、哪个人。如果在5月份进行抽测,学校必须得把课上完,它不能停课来准备。另外,我们的题目确实也不公开。你就是拿到了一些题也没有用,你不知道下次出什么题。我们每年测的科目也不一样,今年可能只测语文和外语,明年可能只测量数学和科学。最主要的是,监测结果和被测者是低利害关系的,其目的就是为了取得真实的数据。所以,我们也把教育质量监测叫常态下的监测。
  监测和统考不一样。因为测一个群体的课程标准达成度,用一套题是不全面的,一套题不能反映课程标准的要求,要有很多套题。那么这么多道题给一个孩子做他是做不了的,我们就必须把它拆成不同的试卷给群体中不同的孩子来完成,所以就学科考试而言,也是很难进行突击准备的。
  记者:刚才您提到还要测学生的学习时间、学习感受,这能保证学生按真实的意愿来填写吗?比如,老师可能会给学生暗示,你们填写学习时间的时候,一定要往少里写。
  胡平平:只能说有这个可能。但是我们在监测的时候,采取了一些很严密的做法。一方面是思想上做工作。因为这个监测跟教师、学校、教育局都没有高利害关系,我只是给你做诊断。你到底存在哪些问题,你需要从哪些方面去改进,所以首先是要打消顾虑,我们一再强调需要真实、客观的东西,否则,政策无法调整和完善。
  另一方面就是从技术上防止弄虚作假。我们设计了测谎题。如果有大规模说谎,肯定会从数据上反映出来,那么一旦发现,这种数据就全部作废。
  记者:我们这种测试与国际上的PISA、TIMSS测试有什么不同吗?
  胡平平:PISA由世界经合组织(0ECD)发起,主要是以能力为导向,测未来劳动力的素养,其被测对象是即将成年的15岁学生。TIMSS是国际教育评价协会(IEA)发起,主要依据参与国的国家课程标准,测试被教育者的教育成效,其被测对象是四、八、十二年级学生。我们国家的教育质量监测类似于TIMSS的定位,也是依据国家课程标准选择对四、八年级学生进行测试。
  不公布捧名,起诊断作用,为政府挺供决策参考
  记者:你们现在监测的范围是多大?
  胡平平:从2007年至2011年连续5年我们在全国不同省(自治区、直辖市)开展了试点监测工作。2012年在全国31个省(自治区、直辖市)和新疆生产建设兵团开展了正式监测。6年来的总监测样本包括525个样本县(市、区)的约40万余名学生、7.5万余名教师和校长。通过监测掌握了全国大部分地区教育质量数据,分析撰写了200余份监测结果报告。
  记者:现在各省也成立了教育质量监测中心,一些地市也相应地成立了质量监测中心,有的地方开展了一系列的测试,甚至是统考。你们怎么看这种现象?
  胡平平:我们鼓励省里成立监测中心,但不鼓励市县都去成立。主要因为质量监测是一项专业性、技术性很强的工作,需要多领域、多学科合作,否则很容易做成统一考试,‘这个我们是不赞成的。
  监测和考试的概念是不同的。如果把监测等同于考试,就把监测的经念歪了。
  日本在上世纪50年代就开始做质量监测,不是统考,但是进行排名,在全国公布,这样一来,学校压力就大了,层层施压,把孩子的负担搞得非常重,除了高考、中考,学生还要应付监测,变成第三座大山了,引起社会的质疑和议会的质疑,后来被责令停止,这一停就停了43年,到2007年才恢复,恢复以后就不再公布排名了。所以我们一开始就吸取他们的教训,特别强调是低利害的,不排名,不公布成绩,但是所有的报告都会给你,你只知道自己的位置,知道自己的问题在哪里,不知道别人的。另外,除教育部外,我们也无权向媒体公布。
  记者:其实你们的目的还是要给政府决策部门提供真实可靠的决策参考信息,帮助他们改进工作,提高质量。
  胡平平:对。由于目前监测抽样方案是为了解全国(不含港澳台地区)总体状况设计,因此获得的数据能准确代表我国四、八年级学生的整体状况,我们将监测结果报告给教育部,供各相关部门决策时参考。而各地样本的数据只在一定程度上反映各样本地区的状况,我们也到每个样本省、县(市、区)反馈监测结果,帮助他们诊断问题,提供改进依据,供各地决策者参考。
  例如,某省教育厅拿到报告后,说这个报告请不要给我们省长。过了一个月,又来找我们说,你们把报告给我们省长吧。因为有些问题,教育内部自己解决不了,希望依靠这个报告去省政府争取政策。
  有的省以为自己的基础教育很好,结果出来后,大吃一惊,立即开省教育厅常务会研究解决问题的办法。
  这些监测结果对下面的震动还是非常大的。5年来监测中心虽然没有通过媒体向社会公布质量监测,但在教育内部特别是在样本地区还是通过对监测的过程的培训和对监测结果的反馈不断进行宣传,其影响在逐步扩大。
  记者:主要是教育质量观不一样了。应该说你们做的这个监测,是在为中国基础教育树立新的教育质量框架。
  胡平平:其实质量、均衡、负担,也是我们国家上上下下都在关注的重点。
  记者:你们这几年的监测做下来,有没有什么意见和建议可以反馈给大家的?
  胡平平:有很多。比如,教师学历方面,教师的第一学历和学生的成绩有很大关系。也就是说教师的人口关必须把好。还有,初中教师必须强调学教一致,也就是你可以以后去进修一些学历,但是你教物理的必须去进修物理,你教数学的必须去进修数学,不能是教物理的去进修中文,这种情况下教的学生在学业成绩上就有差距了。
  再如,教育经费投入要逐步转向教师队伍建设和教育资源(图书资料、远程教育设备等)。因为这两者与学生的学业质量密切相关。后者不但要加大投入,而且应提高使用率。为什么这么说呢?2010年我们测了物理、生物和地理,发现学科成绩与学生动手实验、教师做演示实验都密切相关,黑板上讲实验的,根本就不行。在农村,学生不做实验的比例相当高,生物达到61%,物理达到39.6%。这些都是需要教育决策部门密切关注的。
  还有,去年我们测了英语,教育部要求小学三年级始开设,我们测的是四年级,很多农村地区根本就没开,没开的原因是没有教师。由于小学没有都开,到了初中学生的水平差异比较大。所以,我们也提出建议,一方面要加强师资的配备;另一方面,中考英语分数的权重就不能和数学、语文一样,否则对农村孩子而言就不公平。
  中国基础教育质量监测已经走过了蹒跚学步之年,随着监测工作进入常态化,教育都将会定期向社会公布全国的监测结果,届时大家都会依据结果得到自己的判断。
  记者:我们也很关心这个结果。谢谢您接受我们的采访!

推荐访问:决策者 教育质量 冲击