分类筛选
分类筛选:

关于数据挖掘论文范文资料 与数据挖掘技术在电网资产管理系统中应用有关论文参考文献

版权:原创标记原创 主题:数据挖掘范文 科目:毕业论文 2024-01-29

《数据挖掘技术在电网资产管理系统中应用》:该文是关于数据挖掘论文范文,为你的论文写作提供相关论文资料参考。

[摘 要] 电网资产管理贯穿了供电企业的诸多生产业务范围,其覆盖范围广、体系种类庞杂、数量庞大等特点.在电网资产信息化管理建设进程中,针对电网“数据丰富,信息缺乏”的现状,提倡应大力研究数据挖掘技术,将数据挖掘技术应用于电网建设、运行生产,为电网的建设和运行提供更科学、更可靠的支撑.文章探讨了数据挖掘技术在电网企业中的应用,并提出了相关建议.

[关键词] 数据挖掘;信息系统;资产管理

doi : 10 . 3969 / j . issn . 1673 - 0194 . 2017. 15. 079

[中图分类号] TP311;V242.3 [文献标识码] A [文章编号] 1673 - 0194(2017)15- 0177- 03

0 引 言

随着信息技术的不断发展,各行业大量数据随之产生,为从大量的数据中挖掘出潜在的价值,为生产生活提供支撑,数据挖掘技术逐步发展起来,已在电网信息化管理业务中得以应用.

云南电网信息化建设工作经过多年的实施开展,取得了巨大的成果.2015年,云南电网有限责任公司集中资源,以人资数据先行,协同推进营销、资产、财务和GIS平台业务强关联系统,而由于互联网通信等技术的发展,营销、资产等业务系统的全面实施推广实现了对业务应用有效支撑的同时.这些系统采集、处理、积累的数据越来越多,数据量增速越来越快,以至用“海量、爆炸性增长”等词汇已无法形容数据的增长速度.海量数据需要且已得到存储,如电网设备的状态数据、运行数据、电费计量数据、用户数据、电量数据以及各部分运行参数指标数据等.

同时,因实施推广涉及单位众多、业务广,而各应用单位管控点及方式存在一定差异,如何从多源大数据中及时挖掘出隐藏信息和有效数据,如何及时掌握各业务系统在各单位的应用情况问题,给数据分析处理带来了巨大的挑战,因此,借用数据挖掘技术对各业务数据信息进行分析,实时掌握资产设备情况,提升资产管理水平变得尤为迫切.

1 数据挖掘技术在电网资产管理应用中的必要性

电网资产数据自身存在特点:一是电网企业是一个规模相当庞大的企业,电网资产更是覆盖社会的各个角落及各行各业,电网资产管理的数据不仅多,而且纬度高,数据列多,很难整理;二是在电力资产管理系统中,采集到的数据中包含着诸如设备型号、功能位置、生产厂家、生产日期、投运日期等诸多参数,又兼有专业覆盖层次广等特点,因此,资产数据质量管理较差,严重影响企业资产管理水平;三是电网资产管理企业较多,涉及专业教广,对电网资产属性层级的管理较为混乱,上级企业无法对下属公司资产透彻了解掌握,无法掌握自身家底,数据管理模式比较单一,不同部门的数据信息由各个部门自行处理,只进行简单参考或统计工作,没有汇总到一起进行系统、全面的分析挖掘,导致大量有价值的信息被埋没.因此电网企业迫切需要能够充分合理地进行数据处理的数据挖掘平台.

同时,电网企业产生的数据量大、质量不高,但又对数据要求较高,这就意味着电网企业迫切需要数据挖掘技术来处理海量数据,并发现数据间的潜在联系.

2 数据挖掘技术在电网资产管理中的应用

2.1 数据挖掘的流程及方法

数据挖掘(Data Mining,简称DM)可以应用在各个不同的领域.数据挖掘是一个利用各种分析工具在海量数据中发现模型和数据间关系的过程,使用这些模型和关系可以进行预测,寻找数据间的潜在关联,发现忽略因素.

2.1.1 数据挖掘流程

CRISP-DM为跨行业的数据挖掘提供了一个完整周期的综合展示,形成闭合环,是不断反饋不断完善的动态过程,具体包括6个阶段:商业理解、数据理解、数据准备、建立模型、模型评估和模型部署.

(1)商业理解.从商业的角度上了解项目的要求和最终目的,从目的为切入点,并将这些目的和数据挖掘的定义以及结果结合起来.

(2)数据理解.对可用的数据进行评估和数据标准的选取.(3)数据准备.对可用的原始数据进行一系列的组织以及清洗,使之达到建模需求.

(4)建立模型.在这个阶段可能需要选择和应用不同的建模技术,同时校准模型参数.该阶段主要建立的模型包括关联规则、分类和预测、聚类、异常检测等.

(5)模型评估.该阶段重点挖掘结果和商业目的的吻合度.(6)模型部署.模型部署可以是生成一份报告,或者是一个可重复的数据挖掘过程.

2.1.2 数据挖掘方法

数据挖掘涉及的学科领域和方法很多,以下是几种常用方法.

统计分析:统计分析提供了一种基于多维度、大量历史数据的判别方法,有回归分析、方差分析等.统计分析是根据已有数据对事件运行规律的探索,推断出因果线性关系,计算出线性回归方程.统计分析的优势在和对有确定影响因素的事件,有相对准确的影响因子效力分析.

神经网络:神经网络是模仿人脑神经网络的结构和工作机制而建立的一种计算模型,包括前馈式网络、反馈式网络和自组织网络模型.神经网络的优势是其具有良好的自组织、自适应、并行处理、分布存储和高度容错等特性.

决策树:决策树一般都是自上而下的来生成的.每个决策或事件都可能引出两个或多个事件,导致不同的结果,把这种决策分支画成图形很像一棵树的枝干,故称决策树.决策树对比神经元网络的优点在于可以生成一些规则,对解决多维数据的分类问题很有效,但也会随着分支数的增多,管理难度加大.

粗糙集:粗糙集理论认为知识是有粒度的,利用相对核的概念进行知识关联性分析.该理论能够在缺少相关数据的先验知识的情况下,基于数据的分类能力,解决模糊或不确定性数据的分析处理.

可视化:可视化提供给用户一个人机交互的平台,使数据展示更加清晰、简洁.

数据挖掘论文参考资料:

毕业论文数据怎么找

统计学数据分析论文

大数据杂志

论文数据

有关大数据的论文

数据挖掘论文

结论:数据挖掘技术在电网资产管理系统中应用为关于对不知道怎么写数据挖掘论文范文课题研究的大学硕士、相关本科毕业论文大数据挖掘工具论文开题报告范文和文献综述及职称论文的作为参考文献资料下载。

和你相关的