分类筛选
分类筛选:

关于决策树论文范文资料 与高职院校就业信息平台中决策树应用有关论文参考文献

版权:原创标记原创 主题:决策树范文 科目:职称论文 2024-02-22

《高职院校就业信息平台中决策树应用》:本论文为您写决策树毕业论文范文和职称论文提供相关论文参考文献,可免费下载。

【摘 要】本文利用C4.5决策树算法构造就业决策树,对已毕业学生按计算机能力、英语等级、综合成绩、政治面貌、性格取向等决策属性进行相应分类,并分析其对毕业生的就业类别和方向的影响,从而在提高就业率、就业层次、改进现行培养机制等方面为管理人员提供决策支持.

【关键词】高职院校 就业信息平台 决策树 就业方向 就业决策

【中图分类号】G 【文献标识码】A

【文章编号】0450-9889(2016)10C-0179-03

随着高职院校毕业生人数的增多,就业工作及就业方向指导越发沉重,研究开发就业信息管理平台非常必要.在平台开发中引入决策树这一方法来分析研究,有利于明晰高职院校毕业生的就业方向、增强高职院校毕业生的就业水平.

决策树主要就是将大量的数据进行相应的分类.这些分类中的数据将是研究中给定的数据,通过数据的研究跟预测中的数据对 析,找出其存在的规律属性,并从中找到潜在的、有价值的信息,并利用这些数据对工作上的问题做出指导.决策树方法主要应用的是(CLS)方法,经过研究摸索后来演化为ID3方法,最后经过多方的研究、努力,演化成了总所周知的C4.5算法,该算法也是本文中应用的一种算法.决策树技术主要是把相关的问题分解化,把复杂的问题简单化,从一些杂乱的数据中找出一些有规律的数据,并进行对 类,产生出研究中所需要的结果,并根据相应的结果分析,指导现实中的工作,提高工作效率,强化学习能力.在数据的分析中,得出一些和就业相关的一些基本属性,如毕业生的综合成绩、英语等级、计算机能力以及高考成绩等,并通过对这些属性的分析来判断、预测其毕业后的就业方向和发展趋势.因此,本文设计决策树模型,通过对已工作的毕业生进行相应的分析,得出其实际有效的数据,并结合广西农业职业技术学院学生就业的实际情况进行决策树分析研究,最终指导毕业生的就业方向及就业层次.

一、就业信息转换和预处理

学生就业统计管理信息表主要包括的字段有:学号,姓名,性别,性格取向、院系,专业,综合排名,生源地,计算机能力,英语水平,政治面貌,工作单位,工作单位区域,本文采用的挖掘属性就是从该表中获取.挖掘出给定数据的单位性质,获取一些找到好工作、好单位的毕业生和其哪些属性相关,主要通过学生就业信息表中的数据来进行挖掘对比,由于挖掘的信息量比较大,在数据的挖掘中,首先要进行相应的数据筛选,找出和学生关联度比较大的相关维度属性.如实践能力、综合排名、英语水平、计算机能力、性格取向、高考成绩、工作单位等作为决策属性.在统计的工作单位中,对它们进行符号化,分成不同的层次,具体如下:国企(符号化G),其主要是一些大、中、小型的一些国有企业,一些事业单位、科研单位、政府单位等;外企(符号化W),其主要是一些在中国发展的外资企业;私企(符号化S),私企主要是一些私人企业,一些民企.在这三类单位中,又进行相关层次的分类即优秀(Y)和差(C),以便进行更好区分,把数据进行细化分析.在这些数据的细化后,现在可以把相应的工作单位分成以下几大类,即优秀国企(GY)、差国企(GC)、优秀外企(WY)、差外企(WC)、优秀私企(SY)、差私企(SC),在这些数据确定后,并把所有的数据都进行符号化,然后进行统计分析.

二、模型分析和设计

(一)模型分析描述

高职院校毕业生人数在逐年增加,就业问题也逐年突出.以广西农业职业技术学院为例,虽然加大了投入,千方百计提高就业率及就业水平,也取得了一定的成效,但离理想中的要求还有一定的差距,如何缩短这些差距,是作为学院的决策者必须思考的问题.因此,建立一个学院学生就业信息管理平台,解决就业问题非常有实际意义.在这些大量的数据中找出所需要的数据,给学院的决策者来做出决策支持.在通过对 析后,数据挖掘能很好地解决相关的问题,它能从大量的数据中挖掘出所需要的相关数据,根据此特点选择决策树C4.5算法建立决策分类树,通过已给定的条件来找出学生属性的影响情况.并由相关规则找出就业单位的类别进行排列选取,通过这些属性的挖掘以及数据的整理分析,得到有价值的信息,为决策者进行决策支持.

(二)模型设计

决策树其实就是生成一棵倒立的树,其主要目的就是实现分枝归类,把具有相同属性的值,尽快和相应的分支对应属性,每片叶子代表的是类别的最终属性.通过以上的结构分析,决策树的构建在数据的分析上有很大的优势,很容易从叶子节点上分析得出所需要的数据.

通过C4.5进行对数据归类划分,并进行相应的最优属性值的评估,尽快在最短的分枝路线上进行分类选择,并能有效处理连续值的属性.因此,通过C4.5算法利用数据挖掘,分析出样本中所有的数据,并对所需要的数据,如综合成绩、计算机能力、英语水平、实践能力进行处理分析,并得出毕业生就业好的一些基本因数.这些因数主要通过算法递归分配到每一个节点上,通过数据的处理就可以看出学生的就业跟哪些属性关联性比较大,这样在学生的就业中,就可以做出正确的有方向性的指导.

C4.5算法主要产生所需要的增益率,其计算方法以及相应的计算公式步骤如下:

第一,在已选取的数据中,并把该数据集合表示是S,其中的项目数为s,并通过取不同的属性值,把它设为n,其对应的属性值也为n.另外,在就业信息数据挖掘系统中应用为Qi,(i等于1,2,等,n).假设Bi为类别Qi中的样本数据个数,为每个数据的属性信息计算增益率,并计算机出给定样本分类所需要的信息熵,其计算公式如下:

第二,在分类划分中,属性的值是非常多的,如何取出所有属性的值,并把它归类到每一个节点中,这样就需要取W个不同的值,即{w1,w2,等,wn}.并通过类别属性W值的不同,来获取划分其中的其他节点的分枝值为S,并记为:{ S1,S2,等,Sz }.通过这些子集对应所包含的集合S,并由S的节点产生出来所需要的分枝,通过属性划分的方式,把当前样本集合B,划分成子集的信息熵或信息期望,通过下列公式进行划分:

决策树论文参考资料:

领导决策信息杂志社

决策杂志社

驳论文树靶子

结论:高职院校就业信息平台中决策树应用为关于决策树方面的论文题目、论文提纲、决策树例题经典案例280论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

和你相关的