从水平评估到审核评估：我国高校教学评估理论认知及实践探索_评价动态

从水平评估到审核评估：我国高校教学评估理论认知及实践探索

来源：刘振天中国大学教学杂志

发布时间：2018-09-07 10:05

点击数:次

分享到：

作者简介

刘振天，中国人民大学教育学院教授。

摘要

从水平评估到审核评估，不仅是我国高校教学评估实践的新探索，更是教学评估理论的新认知。这种理论认知及实践探索，集中表现在四个方面：一是在评估理念上，从强调绩效问责走向注重协商对话；二是在评估作用上，从刚性强化走向柔性激励；三是在评估分类上，从单一标准走向多样标准；四是在评估重点上，从教学具体活动走向内部质量保证体系。

关键词

高等学校；教学工作；水平评估；审核评估；评估理论

我国高校教学评估工作始于20 世纪90 年代，历经25 年，期间先后开展过合格评估、优秀评估、随机评估、水平评估、审核评估等几种不同形态的评估。但若从评估规模、效果及其影响来看，毫无疑问当以水平评估与审核评估最为典型、最具代表性。前者全称“普通高等学校本科教学工作水平评估”，习惯上也叫首轮水平评估，自2003 年开始至2008 年结束， 6 年间共评估589 所高校。后者全称“普通高等学校本科教学工作审核评估”，实际上是第二轮评估，开始于2013 年，将于2018 年年底结束， 630 余所高校参加，包括了接受过首轮水平评估的所有高校。在笔者看来，审核评估与水平评估，既一脉相承，又有创新与发展。就此而论，审核评估之于水平评估，不是简单地换个名词或改一种称谓，实际上，在评估理念、标准、内容、方式、技术及组织等方面相应做了一系列调整和变化，表明我国对评估工作或评估制度在理论上有了新认识，在实践上有了新进步。审核评估全面总结和借鉴了水平评估的经验，深入反思并汲取了水平评估的教训，是我国高校教学评估实践的新探索，更是教学评估理论认识水平的新提升。

一、教学评估理念：从强调绩效问责走向注重协商对话

教育评估或评价活动既古老又年轻。言之古老，是因为自教育产生时起就存在着评价。孔子就曾讲，听其言观其行而后知其人。苏格拉底也提到，未经反思和评判的生活没有意义。说它年轻，在于作为一门学问和一种制度，教育评估评价只是在20 世纪初才得以确立，并且在很大程度上受益于工商业发展以及现代企业质量管理理论与实践的启示。在19 世纪前的西方社会，高等教育的标准与质量多由大学内部掌握和控制，政府及社会很少关心和过问。随着高等教育规模不断扩张，入学人数不断增多，大学从过去教会和私人领域逐渐变成国家和社会的公共事业，高等教育也由远离社会一步步走到社会的中心，其事业的发展和扩充，越来越依赖于政府和社会的财力支持。20 世纪70 年代之后，西方国家先后进入高等教育大众化阶段，政府财政投入吃紧且呈减缩态势，相应地，个人教育成本负担增加。在此情况下，无论是政府还是社会与公众，普遍关注教育质量，要求大学对质量做出承诺，由此开启了政府和专门机构主导下的高等教育质量外部问责和绩效评价时代。西方主要国家纷纷制定高等教育质量标准，颁布质量法律，建立质量评价制度，成立质量评价机构，开发质量评估工具，开展质量评估认证活动。有些国家还开展双边或多边高等教育质量相互认证工作，区域性乃至国际性高等教育质量组织得以成立，掀起了大规模国际高等教育质量保障运动。所有这些，对改进高等学校工作、提高高等教育质量具有不可替代的作用。

在世界高等教育质量保障运动大背景下，20世纪80年代中期，我国高等教育质量保障工作亦提上议事日程。1985年，《中共中央关于教育体制改革的决定》首次提出，政府要对高等学校办学水平和教育质量进行评估。此后，教育部在工科高校数百个专业进行了教学评价试点。20世纪90年代，教育部将专业评估转入院校整体性教学评估。1994年，国家对改革开放后批准设立的高校本科教学工作开展合格评估；1996年，开始对那些申请进入国家“211工程”重点建设项目的高校本科教学工作开展优秀评估；1999年，对其他普通高校本科教学开展随机性水平评估。这三种评估工作均持续到2002年，总计评估254所高校，其中以接受合格评估的高校最多。2002年，教育部将三种评估合并为普通高等学校教学工作水平评估，即首轮教学水平评估，从2003年正式实施。虽然此前的三种评估被合并为一种评估，但其在评估思路、评估方案等方面并没有多少实质差别，可视为同类性质的评估模式。

指导首轮水平评估（包括之前的评估）的基本理念与思想，就是人们耳熟能详的评估十六字方针：“以评促建、以评促改、评建结合、重在建设”。随着实践的深入，再增加“以评促管”，发展为评估二十字方针。不管是十六字还是二十字，都代表了那个时期人们对评估理念与功能的总结和概括，反映了人们对评估本质、价值及目的的基本认识和理解。

透过首轮教学水平评估以及评估方针，我们不难发现，教学评估主要是由政府直接组织的，当然要体现政府的意志和意图，体现政府对高等教育质量的问责，评估是为政府对高等教育及其质量实施有效管理和监督服务的。通过评估，政府可以检查高校教学工作是否符合、贯彻和落实了党和国家有关教育方针政策及法律法规要求，检验高校教学效果是否达到了政府规定的质量标准，督促高校进一步加强教学建设、改进教学工作、提高教学质量。为实现上述目的，政府制定了教学评估指标体系，规定了评估标准和评估具体要求，其中不仅有量化指标，还要区分出评估结果等级序列，进而使高校教学与人才培养工作变得可观测、可衡量、可检查、可比较、可参照，进而与一定的奖惩政策制度衔接。

政府对高校教学质量进行问责评估本为分内之职，制定评估标准也是法律赋予的权力，但政府并不是质量问责和评估的唯一主体，否则就会否定和排斥其他组织或群体的价值存在，甚至在某种程度上造成评估本质扭曲、评估目的错位和评估功能变形。事实上，现代高等教育是一个巨大的利益共同体，政府、高校、社会、公众、媒体、家长、学生、校友、用户等诸多群体都有着各自的利益需要和价值诉求，也有着不同的评价标准，高校教学工作评价也是如此。由此，当前国际上出现了所谓的第四代评估理论。这种评估理论认为，先前评估所经历的三个发展阶段（学业测量、实情描述和效果判断）都是理性主义、实证主义、管理主义和功利主义的产物，它们均将评价对象看作被动存在者，评估成了一种权力对另一种权力的压迫、规约和限制。第四代评估理论宣称，评估不是为了检查和证明，不是为了单纯测量和判断，而是为不同利益主体提供平等交流和协商对话的平台；评估是交流对话的机制，是各利益主体相互间围绕着质量与改进所展开的建构性评价活动，评估本身不存在确定性的单一量化标准。第四代评估理论受到各国评估界的高度重视，并以此为指导改进评估认证与质量保障工作，其中众所周知的学校主体、自我评估、持续改进、发展性评价、过程性评价等，就是这一理论的重要表现形式。

在我国，首轮教学水平评估之后，人们对评估经验教训、是非功过进行了认真总结和反思，认识到单纯政府问责、绩效检查和量化评估的局限性。在广泛听取各方面意见，借鉴国际先进理论与模式基础上，教育部对首轮水平评估进行了较大的调整和改造，其重点是合理吸收了第四代评估理论。审核评估这一新术语，某种意义上表达了第四代评估新理念。虽然审核评估并未根本改变也不可能更无必要消除以往评估的说明、检查、鉴定、激励和问责等特质，但它更有意识地注重和突出高校的主体性，强调政府与高校间的平等性，认可评估是不同利益方的沟通和交流，共同就人才培养与教学工作诊断协商、梳理思路、查找问题和谋求改进之道。审核评估明确提出“为国家负责、为学校服务、以学生发展为本位”，学校自我评估是全部评估的基础。审核评估取消了首轮水平评估的等级设置，突出评估的目的在于促进高校内涵建设和特色发展，不再使用统一的评估指标体系这种单一标尺来衡量所有的高校，而是立足高校自我目标定位，用高校自己设立的标准评价高校自身工作及其发展。在评估主体上，除政府评估外，积极鼓励专门机构、高校和社会参与评价，构建多主体、多形式、多渠道的评估制度，给高校发展空间，给公众和社会评价权利，形成多主体竞争与合作的格局。事实上，首轮评估后，第二轮审核评估中，政府除了制定评估标准和规划外，评估的具体组织已经由中央和地方性评估专门机构通过接受政府购买服务的形式获得了评估代理权，第三方评估建设取得了重要进展。此外，社会团体组织的专业认证、高校自主选择参与国际评估业已形成趋势，政府单一评估局面基本被打破，为多方对话和价值表达进而影响高等教育质量决策提供了广阔舞台。正因为如此，新一轮评估受到高校、专家及社会的普遍认可和积极评价。有高校形容，过去接受合格评估是为了生存，接受水平评估是为了声誉，而参加审核评估则是为了自我发展。有专家认为，参加审核评估最大感受就是高校的平常心和开放态，不回避矛盾、不隐瞒问题，学校愿意就教学工作中遇到的问题、困难和困惑对专家敞开心扉、平等交流，期待从专家那里受到启发，找到解决问题的办法。还有研究者指出，审核评估真正体现了教育评价的本质，让评价回归其本来面目和应有位置，它不再是独立于高校教学工作的外在强加物，而成为高校教学工作的内在构成，不再是简单地给高校教学工作下个结论或者贴上等级标签，而是为了帮助学校发展，各方从中都能受益。所以，审核评估较好地平衡了政府、高校和社会三者之间的关系，体现了不同主体协商对话的评估新理念。

二、教学评估作用：从刚性强化走向柔性激励

无论是水平评估还是审核评估，都是政府主导下的外部评估，其问责、说明、检查和督促的作用是既是正常合理的，又是正当合法的。长期大量的评估实践证明，作为督促和问责手段，评估本身也存在一个度的问题，掌握得好、运用恰当，评估就能发挥其积极正向作用；否则，将会适得其反和事与愿违。通常人们所谓的评估是把双刃剑，就是这个意思。

一般说来，评估者总是希望评估工作能够足以引起被评者的充分重视且对其工作产生实质影响，通过评估给工作带来新发展新变化，尤其是作为教学评估政策和评估方案的制定者与组织者，政府部门对评估工作的作用力往往持有更高的目标期待。在我国，评估被赋予特别的意义和价值。在政府看来，教学评估是高校工作的指挥棒和方向盘，是反映高校工作优劣的镜子和衡量教学质量的尺子，是助推高校教学的发动机，是撬动高校工作的强大杠杆，也是推行政策的重要手段，特别是当高等教育领域存在重科研轻教学、重学科建设轻人才培养现象且这些现象和问题日趋严重却见不到有效解决迹象时，政府对评估就更为看重，期待通过教学评估扭转局面。从这点上讲，政府是加重评估强度、提高评估作用力的第一推手。政府提高评估强度和作用力的途径与办法很多，主要有设定评估标准、规定评估等级、量化评估指标、对评估结果进行排名和发布、评估结果与拨款或其他有关政策挂钩等。

与政府相比，在如何对待评估压力和强度问题上，高校的角色及心态可能要复杂得多，有时甚至非常矛盾。首先，高校是被评对象，必须接受政府或其代理机构的评估，如今，评估已经成为世界各国高等教育质量保障的一项长期制度安排，正如美国学者E•格威狄等人所指出的，“所有大学/学院的质量和效率需要定期的评估，特别是本科生的绩效评估应为重中之重”。然而，大学学术自由自治的传统与个性，又使其天然地表现出抵制和拒斥外部评估问责的倾向，时刻提防着外部评估认证对大学自身发展内在逻辑造成的威胁、伤害和破坏，尤其在一些自由主义文化浓厚的欧洲国家，很少有发自内心愿意主动接受评估的大学，即使接受了评估，对评估的非议和负面评价也从未间断过，在他们看来，评估会导致集权化、标准化、忽视大学个性化发展等问题。其次，高校教师的自由职业者特征常常散发出极强的各行其事的个体主义色彩，他们害怕也反感外部机构对自身的教学工作进行评价，教师的这种立场与角色又使得高校管理层面总是试图借助外在的力量对之加以刚性约束和规制，以便强化自身的权力和权威，落实或推行相应的政策与措施，提高行动与目标的一致性，达到工作的高效率和高质量。在这一点上，高校行政管理者又期望提高评估的强度和力度。评估和认证中存在的目标责任层层落实、任务层层加码和压力层层传导现象就是最有力的证明。在行政管理人员心目中，似乎评估的强度或力度与评估的实际效果呈现线性正相关，以为评估强度越大，人们就越重视，效果就越显著，反之，评估强度越小，就越受人轻视，效果也就越差。

[发布者：BJ]

相关阅读： ·第五届中国期刊质量与发展大会在成都顺利召开 ·从水平评估到审核评估：我国高校教学评估理论认知及实践探索 ·教育部等三部门：教师评价不唯头衔、资历、论文 ·我国正建立健全学术期刊管理和预警制度 ·张明海：学术期刊需要核心价值观的引领

期刊评价动态

期刊评价报告

期刊推荐·添加·