从水平评估到审核评估:我国高校教学评估理论认知及实践探索(2)

来源:刘振天 中国大学教学杂志
发布时间:2018-09-07 10:05
点击数:
分享到:
     以高校首轮教学水平评估和目前正在展开的审核评估工作为例,通过比较不难看到,二者在作用强度和力度上恰好形成了明显对照。水平评估被分成优秀、良好、合格与不合格四个等级,每一评估等级所对应的标准和要求不同,等级越高,标准和要求相应也就越高。之所以进行水平评估,在于评估政策制定者和方案设计者不仅试图通过等级评估来客观描述和区别把握我国高等学校教学工作的“真实”水平,更在于刚性强化地方政府和高校对教学工作的重视和投入,进而实现有限资源得到非均衡性优化配置和奖惩的目的。应该说,水平评估在某种意义和程度上确实实现了政策制定者和实施者的初衷,在世纪之交高等教育大发展大扩招条件下,保证了高校教学基本条件、基本秩序和基本质量,也激发了高校之间在办学资源、声望与质量上的竞争。据对2007年198所参评高校的统计,水平评估给高校生均四项教学经费带来超过27%的增长率,而生均教学仪器设备值更是带来33%的增长额。另有调查表明,96%的高校领导认为水平评估作用显著,74%的高校教师认可水平评估的价值。然而,水平评估所设置的高低好差不同级别,不单纯表征不同高校的质量、水平、声誉、地位和影响,甚至主要显示着学校管理者包括其行政管理部门的管理水平、能力和政绩,因此,水平评估最终不由自主地演变成一场围绕等级、名声与地位的激烈角逐。高校对评估的重视,与其说是为了实现评估目的和提升教学工作质量本身,不如说直接为了等级结果、标牌和称号,这势必导致评估变形和目标游移。
 
     2008年水平评估全面结束后,政府、机构和高校各方面对水平评估进行了认真总结和深刻反思,认识到水平评估等级设置的优势与局限,提出了改进评估的基本对策,即取消等级,减轻评估对高校造成的过大压力和过重负担。待到审核评估方案确定后,水平评估等级已被彻底取消,代之以写实性评价,即说明和描述被评高校教学工作哪些方面值得肯定、哪些方面需要改进、哪些方面必须整改,评估压力及评估成本随之大大降低。
 
     不过,取消等级后的审核评估工作,似乎又走入另一极端、陷入另一种困境,评估由以往刚性过大、压力过重、强度过高变成了柔性偏大、压力偏小和强度偏弱。水平评估中存在严重的功利欲、攀比心已经让位于审核评估中的平常心、正常态。审核评估回归了评估应有的面目,它更加强调高校在质量保障中的主体地位和多样化发展生态,学校评估中更加自主、自信和从容,真正把注意力放在学校内涵建设和特色发展方面,不再为外在等级结果所左右,审核评估不打扰学校正常秩序,但由于它注重问题导向,注重与学校平等交流和协商对话,学校放下了水平评估状态下的防御、戒备、博弈和讨巧心理,致力于通过审核评估发现问题、分析原因、寻求对策和提高质量。所以,审核评估得到许多高校和专家的充分肯定和积极评价,认为审核评估是尊重教学规律的评估,是促进学校发展的评估,是指向内涵建设的评估。但平常心之下学校对评估用心不多,正常态之下学校工作状态表现不佳,地方教育行政管理部门和高校对审核评估重视程度不够,审核评估带来的教学激励不大,教学改进实际效果不明显,甚至有图形式、走过场的迹象。所以,有政府管理者、高校领导和专家主张,要辩证对待和评价水平评估与审核评估,充分吸收各自长处,避免各自短处,适当增加评估压力和强度,以此提升评估影响力和作用力,更有效地促进高校本科教学工作,提高教育教学质量。
 
     水平评估到审核评估,评估的作用确实出现了从高到低、从大到小、从强到弱、从刚到柔的明显转换,相应地,人们对评估被重视程度和评估实际效力的判断也出现了变化。如何看待评估的强度和作用力以及由此引起的功用?到底是强度大好还是强度小好?评估作用强度与评估效果是否一定存在明显正相关或者说二者成正比例关系?笔者认为,这个问题比较复杂,不可一概而论。关键要看这种相关性是形式上的还是实质上的,是表象的还是内在的,是一时的还是长远的。无论作用强度大小,外部评估问责都是重要的、不可或缺的,同时,它作为一种手段,必须服从和服务于教育教学自身目的及需要。外部评估问责所承载的功能不可能是无限的,其最终的效果和作用,进一步说,教学工作能否得到改进,教学质量能否得到提升,归根到底取决于学校自己。尤其是高等教育进入实现内涵式发展以及治理体系和治理能力现代化的新时代,政府职能将进一步向法治型和服务型转变,高校办学自主权日益扩大,外部评估作用刚性的空间会逐渐收缩,柔性空间逐渐扩充。由是观之,那种过于相信评估刚性作用的认识并不合时宜,适度柔性实为大势所趋。
 
     三、教学评估分类:从单一标准走向多样标准
     伴随高等教育大众化发展,高等教育的社会化程度也日益提高,其内部分化过程加速。换言之,高等教育大众化、社会化与多样化是密切相关、联为一体,因此才有所谓高等教育的多样发展和特色发展。要实现多样化、特色化,不仅需要高校办学自由自主、主动对接市场和社会需求,而且政府和社会也需要加强分类管理和分类评价。
 
     高等学校分类是重要的教育理论问题和实践问题。中外学界有许多研究,取得了非常可观的成果。但严格说来,已有的研究及成果,各有优劣和长短,并且高校如何分类也是与本土经济、政治、文化与教育基础相适应的,并不存在一个统一的模式。最有代表性的美国卡内基教育基金会依照高等学校职能和学术层级,将高校分为研究型大学(内部又细分为研究型1类和2类)、博士类大学、硕士类大学、四年制文理学院以及社区学院等。其中,研究型大学和博士类大学,重视研究生教育和科研工作,而硕士型大学和文理学院主要侧重本科教学,社区学院则具有升学(本科)教育、职业教育及满足成人个性化发展教育的多种职能。这种分类与美国注重通识教育、研究生教育规模大以及劳动力培训市场高度发达直接相关。与美国不同,欧洲高等教育分类更多从职能划分,主要分为学术型、应用技术型和综合型三类,其中,前两类是欧洲传统的学术性教育与职业性教育双轨制遗产。学术型教育地位高,实科与职业教育地位低。战后在民主化运动影响下,欧洲高等教育的平等化发展迅速,大面积出现学术与职业兼具的综合性中等学校和综合性高等学校。
 
     在我国,高校分类是一个新课题,也是长期以来没有得到很好解决的实践问题。民国时期的高等学校,主要仿效西欧国家,分为综合大学和专门学院。前者侧重学理性或基础性教学与研究,后者则侧重某一方面的专门学问教学。中华人民共和国成立后,全面学习苏联经验,对高等学校进行根本改造,强调高等教育专业属性,除了保留少数文理性综合大学之外,绝大多数高校都是按照狭窄的专业领域甚至产品进行建设和管理,专业多而细。即使是综合大学,内部也存在着严格的专业划分并严格按照专业进行招生、教学、管理和就业工作。改革开放后,特别是新世纪以来,高等教育的大众化发展,市场经济体制的确立,高等教育多样化发展成为必然,高校如何分类和定位也成为突出问题。政府行政部门为了管理及资源配置等需要,组织力量加强了分类研究,社会评价机构为了高校质量、声誉等排名需要,在分类上也进行了许多有益的探索。有的按照职能划分,如研究型大学、教学型高校、服务型高校,进一步又细分为研究型、研究教学型、教学研究型、教学服务型、职业技能型等;还有的按照知识的性质进行划分,如学术型大学、应用型高校、技能型高校等。这些划分尽管各有道理和优长,但若将之应用到具体实践管理和评估工作中,问题和弊端就会暴露无疑甚至寸步难行。例如,严格意义上,不同分类之间的界限应该清晰,最好不要交叉重叠,这样才有利于归类、统计和行政管理,也有利于制定相应的政策。然而,现行的分类办法却难以应用到具体事务管理和政策,分类本身歧义就多,而实际管理中将哪些高校划归哪一类别本身成本也会很高。谁来负责进行分类,用什么方式和办法分类;是高校自主归队,还是行政力量强行划分,抑或通过市场自发归类?这些都是难题。在现实政策与管理中,高校分类归类、分类管理或分类评价的背后,往往是权力和利益的分配与再分配,谁都不愿意在分类中失去权力和利益,因此,分类变成一种权力和利益的博弈。博弈的后果是成本的扩大和增加,无论是政府还是高校都在分类博弈中消耗宝贵的时间和精力。
 
     如果分类的前提或者分类本身不合理不科学,教学评估合理性也会受到质疑。早在1994年教育部开展高校教学工作合格评估时,为了体现评估的科学性、针对性,当时把高校按照综合、理工、农林、医药、师范、政法等分为十个类别,分别制定不同的评估方案与标准进行评估,但实施一段时间后却发现,各科类院校在人才培养和教学工作上,其间的区分度并不很明显,其评估方案和标准过多反而人为地加重了评估的难度,增加了复杂性。所以,到2002年,十种不同的合格评估方案被废弃。不仅如此,合格评估与同时期的优秀评估及随机水平评估也被合并为一个方案,即后来统一的水平评估方案。
 
     水平评估方案大大简化了教学评估工作,也提高了评估效率,降低了评估成本。但新的问题随之出现了。水平评估标准过于单一,没有考虑到不同高校之间的基础和差异,不仅造成高校相互攀比结果,而且导致高校办学模式同质化、划一化,消解了高校特色办学和自主发展,忽视高校不同利益群体多样化诉求。在水平评估即将结束的2007年,教育部成立新一轮评估课题研制组,无论课题组还是教育理论界,不约而同地提出分类评估的要求和设想。有学者提出按照层次分类,如“985工程”大学(39所)、设有研究生院的大学(56所)、其他“211工程”大学、博士学位授予权大学、硕士学位授予权大学、地方本科高校、新建本科高校等。也有学者主张,要按照研究型(创新型)、教学型、应用型对高校进行分类,但问题在于,这些分类设想和研究成果难以操作,不仅造成教学评估方案研制与转化困难,更造成高校在归类归属上的争议与困境,谁也不愿意被归入低一个层次。
 
     分类问题在学理上可以进行探索,但在实践中难以真正得到落实。如何既进行分类,又不使高校在分类中因担心歧视而导致选择困境?经过认真研究和讨论,审核评估在这一问题上做出有益的尝试,取得了重要突破,那就是不把分类作为预设的前提,分类不是预先由政府或评估机构提出,分类方案也不预先由政府或评估机构制定,然后要求学校作出选择。审核评估提出一个非常好的动议,即“用自己的尺子量自己”,把分类这一难题留给学校,让学校根据自身实际情况确定办学定位和培养目标,评估者只是根据学校提出的定位与目标,审度其定位是否符合学校实际与社会需要,是否有足够的资源支持,运行过程与教学效果是否达到了预期定位要求,说的、做的、做的结果是否能够相互印证,是否得到同行与社会认可。这便是审核评估提出的“五个度”标准。
 
     审核评估较为有效地解决了高校分类问题。当然,这种解决是相对的,它是权宜之计,还是理应如此,确实需要人们继续进行深入细致的研究。

     四、教学评估重点:从教学具体活动走向内部质量保证体系
     第四代评估理论出现之前,西方教育评估即已经历了三个阶段,即测量阶段、描述阶段和判定阶段。测量也好,描述或判定也好,就其实质而言,共同特点在于把教育活动及其过程本身作为评价的对象和内容,通过评价证明教育活动过程效率与效果,用以改进教育教学活动,提升教育教学质量。
 
     传统教育评估的理论总体上基于管理主义、科学主义和实证主义,总是相信可以通过那些所谓价值中立的科学客观的评估标准或评估工一点,我们可从现实生活中各式各样的大学排行榜和绩效评价指标体系得出结论。就高校本科教学工作评估看,也没有脱离如此的理念和模式。至于将高校具体的教学工作和教学环节作为评价对象与评价内容,更是我国计划经济体制下所形成的政府注重过程管理和微观事务管理的产物。水平评估及其之前的所有教学评估形式,无不以具体教学工作为其对象,即这种评估评的是学校教学工作过程、环节、内容是否符合规定,是否达标,是否有效。每一种评估都有一整套具体明确的指标体系,不仅设置若干个一级指标,并且每一个一级指标又被划分为若干个二级指标,同样,二级指标下面又设置若干个具体观测点。一般说来,指标体系几乎涵盖或容纳了高校办学目标定位、培养模式、师资队伍、教学条件、专业设置、课程与教学、教学管理、质量与效果、就业等教学工作所有方面和过程。为了能够客观说明、展现与比较学校内部或不同高校间教学工作各方面环节质量与成效,评估方案又根据不同方面、不同环节在教学工作及在影响质量过程中的地位与所起的作用,赋予不同指标以不同的权重。评估政策制定者和实施者通常认为,指标越全面、具体、细致和深入,越能够通过数据或行为加以说明和描述,对教学工作及其效果和质量的衡量就越确切、越容易把握和控制,进而制定相应的针对性的政策与措施。以水平评估为例,该评估方案一级指标7个,二级指标19个(其中高权重的重要或核心指标11个),观测点44个,被评高校要预先根据这套指标体系和标准逐一对照本校教学工作,写出自评报告,说明每一方面和过程实际情况及其效果,尤其是要自我判断,自我做出优秀、良好、合格或不合格等级评价。然后,评估专家根据学校自评报告、自评等级和进校实地考察情况,给出评估结论建议和相应的评估等级。这个等级可能与学校自评等级一致,也可能有较大出入,或者说评估专家组可能认可学校自我评价,也可能更改修正学校的自我评价。
 
     水平评估虽然追求全面性、客观性和过程性,以此来说明学校教学整体工作以及具体方面或环节的工作状况,以便更有效地发挥评估作用,然而水平评估也存在非常明显的问题和缺欠。一是指标体系过于单一,没有考虑到不同学校多样性发展的实际需要,导致评估区分度不高,忽视和制约了学校特色化办学;二是等级标准过于刚性,过于重视教学条件等硬件,学校出现了相互攀比和虚假评估现象,未能有效达到以评促建促改的目标;三是水平评估重视评价学校具体的教学工作过程及其效果,相当程度上限制了学校办学及教育教学的自主性和积极性,学校被动跟着评估指标体系运转,以期赢得理想的评估结果。在某种程度上可以说,水平评估中倡导的以评促建变成以评代建,以评促改变为以评代改,以评促管变为以评代管。
 
     与水平评估相比,审核评估在评估内容和重点方面作出了重大改变。尽管在结构形式与内容上二者看似相近,但实质上却有着明显的变化。一是将水平评估指标体系改称为审核评估范围,一级指标改称为审核项目,二级指标改称为评估要素,观测点改称为审核要点。名称不同,实际蕴含着审核评估不再像水平评估那样过于强调指标体系的刚性规范,而是将评估指标更多的作为一种框架性、方向性和引导性要求,其弹性和柔性空间增大,以有效加强评估的针对性,充分发挥高校主体性和创造性,适应高校大众化和多样化发展需要。二是审核评估的重点不再仅评价具体教学工作及环节,尽管它仍然是评估的主要内容,但审核评估更重视强调评价学校内部质量保证体系建设。审核评估明确提出,要强化高校合理定位、强化教学工作中心地位和强化质量保证体系建设,这是水平评估未能顾及到的。在审核评估看来,只有学校自身建立健全了内部质量保证制度和体系,其教学和人才培养质量才是有保证的。所以,审核评估重点不在于评价学校某项具体工作做得如何,关键是看学校内部是否建立了有效的质量保证体系。
 
     实际上,审核评估正式把质量保证体系作为独立的评估项目(相当于水平评估的一级指标),项目之下设置质量标准、质量组织、质量监控、质量信息、质量反馈和质量改进等审核要素,所有这些构成了完整的高校内部质量保证体系,进而引导并统领着高校质量建设实践。将内部质量保证体系作为审核评估重点,体现了质量保障中学校的主体性,质量标准的系统性,资源配置的有效性,培养活动的针对性,质量措施与改进的持续性,尤其是体现了质量保障工作中不同利益相关者的参与性、互动性和建设性。
 
     有研究表明,外部评估是否有效,是否能长期发挥作用,重要的前提就是与高校内部质量保证对接,或者说外部质量保障的目的在于积极推动和促进学校内部质量保证。当代西方国家大学具有悠久的自由自治传统,对外部的质量保障持批判态度居多,但尽管如此,欧美国家的外部质量保障却坚持上百年,尤以近三四十年为盛,其原因恰恰在于西方外部质量保障活动的目标和重点指向于高校内部质量保证制度和机制,也就是说内部质量保证体系是外部保障和评价的主要目标。美国六大区域认证中心实施的高等学校质量认证,英国高等教育质量保障署(QAA)开展的高等学校质量审核,澳大利亚国家高等教育质量保障局实施的质量评估,均以高校内部质量保证为重要内容。当前我国实施的审核评估即是将直接评价具体教学工作转移到评价高校内部质量保证体系建设,尽管因为我国高校内部质量保证体系建设无论在理论上还是实践上发展都还不健全不充分不平衡,使得这种转变尚不全面也不彻底,但无疑已经是非常大的进步,在引导高校内部质量保证体系建设方面发挥了十分重要的作用。可以预期,随着评估不断深入,高校质量保证体系建设将提升到新的高度。正如有学者指出,“未来评估的重点是审查质量保障体系的适宜性和充分性,核验其运行的有效性。质量保障体系由质量方针、质量目标、质量标准、质量要素、程序文件、质量监控、信息反馈及持续改进等部分构成”。
 
     从水平评估到审核评估,我国在高校教学评估理论、评估制度和评估实践等方面进行了有益探索,取得了可喜进展,当然,这种进展是相对的、有限的,具有鲜明的阶段性特征,但由此也说明,高校教学评估理论发展与评估实践探索不会有止境。
 
     (参考文献略)
     (原载《中国大学教学》2018年第8期)

 

[发布者:BJ]
  相关阅读:  ·第五届中国期刊质量与发展大会在成都顺利召开  ·从水平评估到审核评估:我国高校教学评估理论认知及实践探索  ·教育部等三部门:教师评价不唯头衔、资历 、论文  ·我国正建立健全学术期刊管理和预警制度  ·张明海:学术期刊需要核心价值观的引领
期刊评价动态