基于决策树算法的高校教学质量评价研究

●左荣欣 陈昭稳

近年来,随着数据库技术的快速发展和管理系统的广泛应用,收集到的数据越来越多,这使得在数据库中查找有用信息变得非常重要。因此,数据挖掘技术作为解决这一问题的有效方法越来越受到人们的关注,并取得了很大的成就。如今,它广泛应用于商业、金融、工业和商业。随着数据挖掘技术的不断发展和应用,数据挖掘技术在高等教育中的应用将对提高教学管理水平起到重要作用。

教学评价是根据教育目标和标准对学校教学进行系统研究和评价,以评价学习过程中活动和学习结果的价值。它是学校教育管理的重要组成部分,是衡量教育效果的重要工具。每学期,学校都会进行教育评估调查,收集大量数据。然而,目前的教育评价主要是基于教师晋升和员工评价的数值计算。本文分析了各种数据挖掘方法,将决策树算法应用于高校教学评价,并进行数据挖掘,研究影响教育效果的因素及其关系,以更好地理解教师教学质量评价与各类属性之间关系。

决策树(Decision Tree)是机器学习中一种常见的算法,它的思想非常朴素,就像我们平时利用选择做决策的过程。决策树是一种基本的分类与回归方法,当被用于分类时叫做分类树,被用于回归时叫做回归树。

一般情况下,一棵决策树包含一个根节点、若干个内部节点和若干个叶结点。

根节点:包含样本全集,从根节点到每个叶结点的路径对应了一个判定测试序列。

内部节点:表示一个特征和属性。每个内部节点都是一个判断条件,并且包含数据集中,满足从根节点到该节点所有条件的数据的集合。根据内部节点的属性测试结果,内部节点对应的数据的集合别分到两个或多个子节点中。

叶节点:表示一个类,对应于决策结果。叶节点为最终的类别,如果该数据被包含在该叶节点,则属于该类别。

如下图中,其中圆和方框分别表示内部节点和叶结点。

简而言之,决策树是一个利用树的模型进行决策的预测模型,表现出的是对象属性与对象值之间的一种映射关系,简单明了,非常容易理解。

我们决策树学习的目的是为了产生一棵泛化能力强,也就是能够高效、有效处理未见示例的决策树。

一般来说,使用决策树进行分类可以分为两个阶段。在第一阶段,应通过递归生成决策树形成序列来构建决策树。在第二阶段,应使用决策树模型对输入数据进行分类。建立决策树的过程非常重要。本质上,决策树的生成是一种贪婪算法。对每个未分类节点进行测试,以找到从顶部节点开始的一组示例属性(测试属性)。根据测试结果,将训练实例划分为几个子集,每个子集形成一个新节点,并重复训练,直到达到新节点的闭合条件。建立决策树的一个重要部分是测试特征的选择和样本集的分布。为此,不同的决策树算法使用不同的方法。一些决策树算法已经逐渐发展起来,如CLSJID3、CHAID、CART、FACT、C4.5、GINI、SEE、SLIQ、SPRINT等。最著名的算法是昆兰提出的ID3和C4.5算法。

ID3算法是一种基于熵减法理论的描述性属性优化选择方法。要测试的属性是当前样本集中信息值最高的属性。由于待测试属性的值不同,样本被划分为尽可能多的子集,并且与样本对应的新节点被添加到决策树中。这种方法减少了对项目进行分类所需的测试数量,并确保只能使用一个简单(不一定是最简单的)树。

在上图中,pi是属于C概率的任意样本;
使用s/s进行估算。注:对数函数基于2,因为信息以二进制编码。

在上面的公式中,I(S1j,S2j,…,被作为第j个,这是样本在sj中属于Ci的概率。这样,通过使用属性A划分当前分支节点的相应样本集获得的信息增益为:

ID3算法根据信息论理论,采用划分后样本集的不确定性作为衡量划分样本子集的好坏程度,用“信息增益值”度量不确定性——信息增益值越大,不确定性就更小,这就促使我们找到一个好的非叶子节点来进行划分。通过ID3算法,计算各个影响因子的信息增益值,逐步建立各个影响因子的一棵决策树。

考虑到目前的技术水平,本文重点介绍了ID3算法,该算法应用范围广,使用方便,在教学评价系统中常用作决策树。基于现有的评价结果和教师的先验知识,我们旨在开发一个优秀教师教学质量评价模型。

分类数据分析的阶段通常包括数据收集、数据预处理、数据分类、分类规则分析和知识应用。在本文中,该阶段用于描述开发教学评估决策树模型的过程。

高校教学越来越重视教学质量,越来越多地使用数据挖掘技术来管理教育教学质量。通过将教学质量评价标准应用于教育政策,高校教学领导有了做出正确决策的坚实基础。作为高校教学信息管理不断完善的一部分,越来越多的评估数据被收集到在线质量评估系统中。评估数据库与其他数据库和大学教学的广泛信息相连接。了解这些来源,不仅可以为高校教学管理部门提供评估结果,还可以提供其他重要信息。

我们使用关联规则对决策树的预测模型进行了测试,结果基本一致,这部分反映了预测模型的高可靠性和适用性。

首先,对教师的年龄、职称、学历、性别和评价结果进行ID3算法分析,分析表明,它们与现实是一致的,即教师年龄越大教学质量评价越高;
教师职称越高,教师的教学质量评价越高;
教师的教学和实践经验越丰富,教学质量评价越高;
教师的性别对教学质量评价影响不大。然而,数据分析表明,教师学历与评价结果之间的关系是不对称的,原因如下:首先,我国高校年纪较大的教师,虽然他们的学历不高,但是他们的教学质量评价较高。而近年来,新招聘的年轻教师,他们的学历是比较高的,但由于他们教师实践经历不足,在教学质量评价中,他们的教学质量评价不高。即使是年龄相仿,本科毕业就来学校工作与研究生毕业来校工作,因为本科毕业生比研究生毕业的教师的工作经历要多,在教学质量评价中,他们两者之间比较,并没有多大区别。

其次,对实际教学中的学生人数、课程类型进行分析表明,30人以下的班级教学质量评价较高,人数增多,教学质量评价则下降;
选修课和必修课进行比较,选修课的教学质量评价低于必修课。实践课与理论课比较,实践课教学质量评价低于理论课教学质量评价。原因是实践课在教学组织和教学手段使用上,存在更大的难度,评价主体不便于科学评价实践课,所以评价质量较低。

再次,对教学方法和教学资源建设进行分析表明,教学方法手段的有效应用能提升教学质量评价数据,如采用信息化教学手段则比不应用信息化教学手段的教学质量评价数据高,采用实际案例教学比不采用实际案例教学的教学质量评价要高,采用学生自学后再请学生讲解的方法与教师自己讲述内容的方法比较,前者教学质量评价更高。教师建立并充分恰当使用教学资源的教学质量评价较高,因为有助于学生课前自学,课中答疑解惑,解决课程难点和重点。

教学质量是教育效果的外在表现。教学质量评价旨在指导、支持、激励和规范教学质量。它是学校管理的重要组成部分,是评价教育绩效的重要工具。将数据挖掘技术应用于质量评估具有重要的现实意义,因为它为高校开展和支持课堂评估、提高教学质量提供了定量依据。为了更好地描述优秀教师所需的条件,该模型需要补充某些指标,如工作量、研究技能等。此外,还可以使用其他数据挖掘算法(如相关规则)来提取教学信息,需要进一步分析。数据挖掘技术已经在许多领域得到了应用,其早期应用表明,它在教学中具有很大的潜力,可以帮助解决当前教育系统中的问题。基于教育的大趋势,数据挖掘技术在教育领域的数据分析具有非常广阔的前景。利用决策树和相关规则建立高校教学评价框架,能够达到综合研究高校教学质量评价的目的。

猜你喜欢 决策树数据挖掘教学质量 努力改善办学条件 不断提高教学质量中小学实验与装备(2021年4期)2021-09-03探讨人工智能与数据挖掘发展趋势大众投资指南(2021年35期)2021-02-16关注学习过程 提升教学质量甘肃教育(2020年18期)2020-10-28提高教学质量,重在科学管理华人时刊(2019年17期)2020-01-06一种针对不均衡数据集的SVM决策树算法成都信息工程大学学报(2019年3期)2019-09-25决策树和随机森林方法在管理决策中的应用电子制作(2018年16期)2018-09-26基于并行计算的大数据挖掘在电网中的应用电力与能源(2017年6期)2017-05-14基于决策树的出租车乘客出行目的识别中央民族大学学报(自然科学版)(2016年4期)2016-06-27提高语文教学质量的几点思考人间(2015年10期)2016-01-09一种基于Hadoop的大数据挖掘云服务及应用信息通信技术(2015年6期)2015-12-26

推荐访问:教学质量 算法 评价