分类筛选
分类筛选:

关于数据挖掘论文范文资料 与基于TDC模式数据挖掘课程教学新方法有关论文参考文献

版权:原创标记原创 主题:数据挖掘范文 科目:文献综述 2024-04-14

《基于TDC模式数据挖掘课程教学新方法》:关于免费数据挖掘论文范文在这里免费下载与阅读,为您的数据挖掘相关论文写作提供资料。

摘 要:文章通过对目前“数据挖掘”课程教学中存在问题的调研,结合实际工作中的见闻和思考,并汇总相关文献的研究结论,提出解决教学中所存在问题的整体方案.该方案可归结为以“理论”、“数据”、“代码”为核心的TDC教学模式,从而提出一种大学数据挖掘课程的新式教学方法.

关键词:数据挖掘 任务驱动法 TDC教学模式

中图分类号:F222 文献标识码:A

文章编号:1004-4914(2015)05-253-02

一、引言

数据挖掘作为一门新兴的学科,是高等数学、统计学以及数据库技术等交叉发展的产物,它广泛应用于商业、工程、医学、农学等诸多领域.随着我国社会经济的发展,各行业信息化程度不断提升,产生了可供分析挖掘的海量数据.因此,如何充分利用这些数据并从中提炼有价值的信息,成为学术界日益关注的焦点问题.近年来,为紧跟社会发展的步伐,国内外高校纷纷开设数据挖掘课程,该课程具有鲜明的时代特点和较强的实用性,受到了学生们的广泛欢迎,但又由于课程内容复杂、模型众多、理论较抽象、对数学基础要求较高,在教学过程中也暴露出一些问题,主要表现为:

一是课程理论部分内容特别丰富,且呈不断膨胀趋势,如果不适时地改革传统教学方式,新内容将使学习者应接不暇,对授课教师也形成不小的压力.

二是适合于课堂教学并且生动有趣的实例数据相对较少.由于有价值的数据资源大多存在于金融、电信、保险等行业,而这些数据往往涉及行业机密,因此,寻找合适的数据资源以供课堂教学使用并非易事.

三是适合于课堂教学使用的示例程序相对较少.目前可以呈现数据挖掘效果的软件有不少,可方便地从输入数据中挖掘出结果,适合于商业使用,但对于以学习原理为目的的学生而言并无补益.

针对上述诸多问题,一些教学研究者从不同的角度提出了改革建议,如:覃义(2012)提出数据挖掘的教学应和实验相结合,并且应和验证式的实验形成区别,避免给学生提供数据而让学生按照步骤进行挖掘的方式,以培养学生的实践能力;王丽丽(2013)提出以CDIO(构思、设计、实施、运作,Conceive, Design, Implement,Operate)理念为指导,以CDIO过程为主导,以项目驱动法为方法,改革课程教学方式,对教学目标、教学内容、教学方式进行重设,增加项目教学,实践证明,上述改革举措能有效培养学生思考和主动学习的能力、提升工程实践和团队合作能力.而黄岚(2014)从教学资源的角度出发,提出通过构建三大类挖掘资源库以辅助教学的模式.但这些新的改革方案都是从某一特定角度出发,解决了当前数据挖掘教学中存在的某些具体问题,具有局限性,正如李卫华(2014)指出,项目驱动法仅适用于小班化教学,当班级人数超过50时,该方法无法顺利开展,其局限性显而易见.

为了对数据挖掘课程的整个教学模式进行根本性、彻底性的变革,笔者经过反复思考,结合和授课同学交流的体会,提出一种T(理论,Theory)、D(数据,Data)、C(代码,Code)相结合的新式教学方法.T为大纲规定的理论性内容,D为精心准备的各行业案例数据,C为实现具体算法的程序代码.该教学法让同学们在编程实战中学会并掌握数据挖掘的基本理论,同时还初步掌握1~2门编程语言.整套改革方案包括如下相互联系的几个组成部分.

二、重设课程教学大纲

当前,数据挖掘课程教育界有一套公认为标准的教学大纲,是2006年由美国计算机学会数据挖掘专门兴趣小组(ACM SIGKDD)拟定的.SIGKDD的大纲从数据库、数据预处理、统计推理等8个方面入手,将课程教学内容分为基础和高级两个专题.其中,基础部分包括:导论、数据预处理、数据仓库和OLAP、关联规则和频繁模式挖掘、分类、聚类和孤立点分析、时间序列和序列模式、文本和Web挖掘、数据挖掘的可视化、数据挖掘应用10章;高级部分包含基础部分后9章的全部内容,另外还引入了更复杂的算法及数据流挖掘、时空和多媒体数据挖掘等内容.

可见,大纲规定的内容,特别是高级专题部分,具有随社会发展不断膨胀的特点,而本文所提出的教学改革方案,是以不增加课堂教学总学时为前提的.不仅如此,还将考虑增加程序设计部分的讲授内容,由此要求对“标准版”大纲的内容实施裁减,新的大纲以“让学生掌握基本的数据挖掘理论”为前提,适当删减理论部分的内容,增加课程实践部分的学时.例如,在决策树分类算法部分,介绍ID3算法这一典型即可,对其变种C4.5可交给同学自学,综合而言,对标准版大纲的重新组织方案可参看表1.

按照这种方案对教学内容删减之后,并不会削弱同学们对数据挖掘基本理论的理解,这是由于这些算法中,所保留的基本算法或原型算法往往能体现某一大类算法的本质特点,而所删减部分的内容只是在细节问题上和原型算法有一些差异,无关算法的核心内容,这就解决了Theory部分的教学问题,而利用所节余的时间,辅以程序实现(Code)的教学,反过来还能进一步夯实所学的理论,加深理解.

三、全方位多角度改革教学方式

(一)搜集有价值的案例数据

数据在数据挖掘课程中的重要性也许是所有课程中最重要的,2014年,学者黄岚专门研究了课程数据资源库的建立之于课堂教学的重要意义.为取得良好的教学效果,激发学习热情,须要精心选择一批好的案例,搜集一批具有一定规模的数据,避免纸上谈兵.例如,用于频繁模式发现的数据,其事务条数至少应达到上百或以上规模,才能体现本课程的价值.当然,这些实例数据的来源应当真实可靠,有说服力,并且和社会普遍关注的问题有一定相关性,这样才能更好地抓住受众的眼球.例如在讲授时间序列分析时,可采集一批股票或期货市场的价格数据.为做好数据准备工作,任课教师团队须要投入一定的时间精力和学术界、企业界交流,争取他们在数据上对大学教学工作的支持.

数据挖掘论文参考资料:

毕业论文数据怎么找

统计学数据分析论文

大数据杂志

论文数据

有关大数据的论文

数据挖掘论文

结论:基于TDC模式数据挖掘课程教学新方法为关于本文可作为数据挖掘方面的大学硕士与本科毕业论文大数据挖掘工具论文开题报告范文和职称论文论文写作参考文献下载。

和你相关的