分类筛选
分类筛选:

关于数据挖掘论文范文资料 与软件工程数据挖掘技术有关论文参考文献

版权:原创标记原创 主题:数据挖掘范文 科目:专科论文 2023-12-27

《软件工程数据挖掘技术》:本论文可用于数据挖掘论文范文参考下载,数据挖掘相关论文写作参考研究。

摘 要:随着计算机软件技术的不断发展,传统的软件维护工作越来越难.数据挖掘技术能够从软件工程数据中提取所需数据,从而有利于软件开发顺利完成.因此,软件工程数据挖掘技术的研究工作具有重要的应用价值.本文首先对数据挖掘技术的相关概念进行介绍,然后,对其面临的挑战及其未来发展方向进行分析.希望能够为有关的研究人员提供一些参考.

关键词:软件工程;数据挖掘;发展趋势

中图分类号:TN918;TP311 文献标识码:A

1 引言(Introduction)

数据挖掘技术既是在海量的数据当中将需求信息挖掘出来的过程[1].软件工程数据挖掘则是数据挖掘技术在软件工程领域的重要应用[2].软件工程数据挖掘技术可以有效地提高软件的开发效率,增强软件的稳定性以及可用性,随着软件工程数据挖掘技术的不断提升,其应用范围更加的广泛[3].因此,对其的研究工作不仅具有重要的学术价值,更具有重大的实际应用价值.本文重点探索软件工程数据挖掘技术面临的挑战以及将来的发展趋势.

2 软件工程数据挖掘(Software engineering data

mining)

(1)软件工程数据挖掘的必要性

软件工程数据主要是指在软件开发阶段积累的相关数据,其中包括软件的可行性分析以及需求分析文本,软件的注释或者代码等等.这些信息是软件开发者获取软件相关数据的唯一来源.随着软件研发技术以及规模的不断提升,其中包括的软件工程数据也是成指数性增长.例如:Linux操作系统软件,其仅代码一项就超过了500万行.这在无形中增加了软件开发者获取软件相关数据的难度.因此,借助于数据挖掘技术的软件工程信息搜索技术是十分必要的.

(2)软件工程数据挖掘任务及其过程

一般来讲,软件工程的数据挖掘工作主要包括:

a.软件数据的预处理.这一过程主要是将未曾加工的数据变为便于挖掘出来的形式.其主要涉及到不同来源以及格式数据的融合,进而转化成为统一格式的数据.选取数据挖掘任务有关的数据记录,并对数据中的噪音以及重复值进行清理.目前,数据挖掘的预处理技术主要采用的是LSA、PLSA、LDA等.

b.数据挖掘.这一过程主要是要将海量数据中能够反映出软件本质或者规律的信息搜取出来.其中运用了大量的算法.输入的是结构规整的数据,而将关联、分类等信息模式进行输出,这些信息模式与挖掘任务有关.

c.结果评估.这一过程的目的就是要是用户获得有用的信息.主要包括提出信息质量不高的部分结果数据,以及将计算机处理以及理解的信息模式转换成为用户能够理解的信息模式,并传递给用户.

2 软件工程数据挖掘存在的挑战(Challenge of

software engineering data mining)

(1)软件工程数据复杂度高

目前的软件工程数据主要包括结构化和非结构化两类数据.其中,结构化数据主要涉及到软件的版本相关信息以及缺陷报告等.非结构化数据主要包括一些软件代码、文档等.这两类数据不能采取同一种算法,但是两类数据之间却又存在着诸多相关性.因此,在数据挖掘算法开发上,要充分的考虑到两类数据的复杂联系,无形中增加了不小的难度.

(2)分析方法并非传统模式

软件工程数据挖掘工作的最后阶段是将获取的挖掘信息呈现给所需用户.在传统的数据挖掘应用过程中,例如:银行或者电子商务,都是将其转化为文字或者图表的形式.但是,软件开发者所需的信息并没有如此简单.其囊括了编程模板、缺陷定位等客户信息.因此,这对数据挖掘技术提出了更高要求.

(3)数据挖掘结果评价标准不一

数据挖掘技术在很多行业都已经广泛应用,并且,在结果表示以及评价标准制定等方面较为成熟,但是,在软件工程数据挖掘领域却不是这样.软件开发者需要获取的信息不仅详细而且极为复杂,同时,信息的表示方法也不尽相同,这样一来,为信息对比增加了不小的难度,因此,很难对数据挖掘结果进行定量准确分析.

3 软件工程数据挖掘问题的解决方案(Solution of

software engineering data mining)

(1)数据复杂性解决方法

软件工程数据的复杂性主要包括三方面:

a.数据的类型相对复杂.关于这一类型,目前一些学者提出可以从软件程序的结构图以及文本数据等方面进行信息挖掘.

b.数据间联系复杂.这一类型可以利用算法的改进,增强发现数据之间联系能力来提升数据挖掘结果的准确程度,例如:社会网络分析法比较适用于尚未存在大量研究工作的领域.

c.数据中存在噪音或缺失.这一类型可以采用类似于半监督学习的方法以达到有效控制因数据缺失所带来的不良影响程度.

总而言之,通过数据挖掘算法的不断改进,能够有效地解决数据复杂性问题.

(2)非传统分析的解决方法

相对于文字、图表等信息形式,软件开发者往往更需要软件使用范例.目前,很多研究成果会涉及到软件使用例程以及编程规则等.同时,在软件工程当中,程序可视化作为一种信息表示方法正在逐渐成为趋势,其与数据挖掘技术相结合,将会极大的满足更多的非传统分析需求.

(3)挖掘结果评估问题解决方法

传统的评估体系很难在软件工程数据挖掘中应用.为了解决这一问题,一些研究者试图利用缺陷检测效果评估法进行挖掘数据评价,但是,这种方法有点以偏概全的嫌疑.还有一些学者采用用户体验评价方法,但是在用户较少的情况下,结果评价的客观性不足.软件工程领域无论是理论研究还是实际应用,其服务对象始终都是人,由此可见,软件工程数据挖掘的结果评价方法会越来越贴近人类心理学以及管理学中的分析方法.

数据挖掘论文参考资料:

毕业论文数据怎么找

统计学数据分析论文

大数据杂志

论文数据

有关大数据的论文

数据挖掘论文

结论:软件工程数据挖掘技术为关于对写作数据挖掘论文范文与课题研究的大学硕士、相关本科毕业论文数据挖掘论文开题报告范文和相关文献综述及职称论文参考文献资料下载有帮助。

和你相关的