分类筛选
分类筛选:

关于关联规则论文范文资料 与基于关联规则挖掘学生评教结果分析有关论文参考文献

版权:原创标记原创 主题:关联规则范文 科目:文献综述 2024-04-10

《基于关联规则挖掘学生评教结果分析》:本文关于关联规则论文范文,可以做为相关论文参考文献,与写作提纲思路参考。

摘 要:利用Apriori算法对1355个课堂的学生评教结果进行了关联规则挖掘.挖掘结果表明学生对具有硕士学位职称为正高级年龄超过46岁的教师的教学效果评价较差,对具有副高级职称年龄在35岁及以下的教师的教学效果评价较好.本文据此提出了相应的教学建议.

关键词:学生评教;教师特征;关联规则

0 引言

随着我国高校信息化水平的不断提高,几乎所有高校的教务管理或教学质量监控部门都引入学生评教系统并开展了学生评教工作,积累了大量的学生评教数据.一些高校的教学管理人员已经意识到了学生评教数据中蕴含着对提高教学质量有用的潜在信息和知识,并逐步着手开展了对学生评教数据的分析和挖掘.其中,将数据挖掘中的关联规则挖掘技术应用到学生评教数据以发现教师背景特征和学生评教得分之间的内在联系是一个研究热点.如周秀梅、李高菊等通过关联分析发现教师的职称和年龄会影响教学效果,教师的学历和性别对评教结果的综合分数无显著影响[1-2].张美华等通过对300份数据进行关联挖掘发现30-40岁之间具有中级职称的教师容易被学生接受,學生对初级职称教师反映问题较多[3].杨钧的关联规则挖掘结果表明,专业技术职务为正教授的教师平均得分最高,副教授和讲师平均得分相差不多[4].张砚雪利用分层次法关联挖掘对教师测评系统数据库中的数据进行分析发现,具有副高职称的教师,学生评价分数很高,助教职称的教师则没有得到学生的认可[5].

然而,通过对大量的文献分析发现,目前研究人员在使用关联规则挖掘学生评教数据时基本上只考虑了规则的有效性,对规则实用性的关注不够.另外,所使用的数据来自于部分学院甚至个别专业的少量数据,数据的代表性和证明力略显单薄.本文利用Apriori算法对某部属高校学生评教的真实数据进行挖掘,找出高校教师自身特征和学生评教结果之间的关联规则,以期为培养高素质的高校教师队伍进而提升高校教学质量提供实证研究依据.

1 数据来源及预处理

本研究所需要的数据包括学生评教数据和教师自身特征基础数据.学生评教数据来自于某部属高校2014-2015学年度第2学期学生评教数据库中的原始数据,教师自身特征数据来自于该校人事管理系统的基础数据库.

学生评教数据在使用之前进行了数据筛选、课堂评教平均得分计算和离散化、缺失值和异常值去除等预处理,共得到1399个课堂评教数据.其中缺失值是由于部分学生未对所修课程所有评分指标进行评分造成的.异常值包括因学生恶意差评[6]导致总分少于40分的学生数据记录和评教人数少于10人的课堂记录.评教得分离散处理时将全校所有课堂按最终平均得分排名,前三分之一为优等级,中间三分之一为中等级,后三分之一为差等级.

教师自身特征数据经过数据筛选、专业技术职务名称统一和年龄离散化等处理,共得到1490位教师数据.其中原始数据中的教授和正高级统一为正高级职称,副教授和其他副高级统一为副高级职称,讲师和其它中级统一为中级职称,助教和其它初级统一为初级职称.年龄的离散化处理将年龄为36岁以下的教师归为青年教师,36-46岁之间为中年教师,46岁以为老年教师.

最后,将学生评教数据和教师自身特征基础数据按教师工号连接合并.因部分外聘教师信息登记不全,连接后的数据中有44个课堂的教师基本信息存在缺失值,去除后剩余1355条记录为本研究最终使用数据,结构如表1所示.

2 研究方法及工具

关联规则挖掘用于发现数据项之间的密切程度或关系,对于给定的项和事务集,通过对事务集的分析,挖掘出项集中项之间的相关性.挖掘出的结果通常以规则的形式描述,称为关联规则.关联规则的一般表示形式为X→Y.其中X称为规则的前(左)项,可以是一个项或项集.Y称为规则的后(右)项,一般为一个项,表示某种结论或事实.

一般情况下,可以从数据中找到很多关联规则,但并不是所有的关联规则都有效且实用.必须采用一定的测度指标筛选出有效且实用的关联规则,这些规则称为强关联规则.强关联规则常用的测度指标包括支持度(support)、可信度(confidence)和提升度(lift).

支持度用于测度关联规则应用的普适性,其值为前项和后项同时出现的概率,数学公式如式(1)所示,式中|T|表示事务总数.

可信度用于测度关联规则的准确性,其值为包含前项的事务中同时也包含后项的概率,反映出前项出现的条件下后项出现的可能性,数学公式如式(2)所示,式中|T(X)|表示包含项X的事务数,|T(X∩Y)|表示同时包含项X和项Y的事务数.置信度高说明前项出现时后项出现的可能性高.

置信度和支持度用于测度规则的有效性,即那些具有较高置信度和较高支持度的规则才被认为是有效的规则.实际挖掘过程中,通常需要根据实际情况指定最小支持度和最小可信度.

有效的关联规则并不一定实用.因为这些规则可能揭示的仅仅是一种随机关联关系,也可能揭示的是反向关联关系[7].因此,在进行关联规则挖掘时不仅要考虑规则的有效性还要考虑规则的实用性.

提升度用于测度规则的实用性,其值为规则置信度和后项支持度之比,数学公式如式(3)所示.

提升度反映了规则前项的出现对规则后项出现的影响程度.有实用价值的规则是那些提升度大于1的规则,因为只有提升度大于1才能说明前项的出现对后项的出现有促进作用.

本研究利用关联规则挖掘的思想挖掘学生评教平均得分等级和教师自身特征之间的强关联规则,其前项为教师自身特征即性别、职称、年龄和最高学位中一项或多项的组合,后项为平均得分等级.研究过程利用R语言中的相关函数实现.

3 挖掘过程及结果分析

采用R语言软件,利用关联规则挖掘技术中的Apriori挖掘算法,对预处理之后的数据进行挖掘.首先在R语言GUI窗口中安装和加载Apriori函数包arules,通过read.table函数将预处理后的数据读入到数据框Data中并转换为Transaction类的实例格式,调用apriori函数进行关联规则挖掘,最后去除冗余规则后利用inspect函数查看挖掘结果.用R语言实现过程如下:

关联规则论文参考资料:

文后参考文献著录规则

结论:基于关联规则挖掘学生评教结果分析为关于关联规则方面的的相关大学硕士和相关本科毕业论文以及相关关联规则apriori算法论文开题报告范文和职称论文写作参考文献资料下载。

和你相关的