分类筛选
分类筛选:

关于聚类论文范文资料 与基于聚类分析智慧城市事部件数据有关论文参考文献

版权:原创标记原创 主题:聚类范文 科目:毕业论文 2024-01-19

《基于聚类分析智慧城市事部件数据》:该文是关于聚类论文范文,为你的论文写作提供相关论文资料参考。

[摘 要]在智慧城市的建设过程中,大量运行数据伴随着城市管理事部件的处置产生并积累.为分析此类数据,本文利用聚类分析技术,以温岭市太平街道为例,对数据进行挖掘分析,产生辅助管理者决策的有用信息,探究应用于智慧城市建设的新知识,提升浙江省智慧城市建设的水平和效能.

[关键词]聚类分析;智慧城市;城市管理

doi:10.3969/j.issn.1673 - 0194.2016.22.085

[中图分类号]F275;F224 [文献标识码]A [文章编号]1673-0194(2016)22-0-02

伴随着城市化迅猛的发展,城市管理中事件和部件量呈现指数型增长的态势.城市管理各部门固有的单一直线的管理模式面临挑战,部门间信息流通不畅、协同性差的状况已不能满足现代化城市管理的要求.为解决这一难题,近年来,政府通过大推动智慧城市建设,将信息化技术应用于城市管理,采用将城市分区网格化管理,利用数字化传输技术,产生城市管理多方联动效应,提升城市的管理水准和效率,力求实现长效科学管理城市.

1 智慧城市现状

智慧城市是在发达的互联网、物联网基础上建立的,构建应用云计算技术的城市管理平台是必需配置.智慧城市的根本目的是应用信息技术,实现城市范围内多部门多行业多群体的数据融合,其智慧性就体现在对城市管理运营数据的创新应用,即对数据的分析应用度决定了智慧城市的成熟度.从大量数据中可以发现知识、提升智能、创造价值,依托数据分析,为政府管理决策提供强大的支持,提高城市居民的生活品质,提升企业的核心竞争力,即城市管理可以从经验治理转向科学治理.

目前,浙江省大部分城市已建立智慧城市(数字化城市管理)信息平台,多部门实现信息数据共享、协同管理合作,实现以信息化手段对城市管理中公用设施、市容环境和环境秩序等的监管.在智慧城市建设过程中,信息系统经历数据采集、数据录入、数据审核和数据库更新,积累了大量纷杂而珍贵的信息数据.这些数据是平台运行的灵魂和價值所在,从海量的原始数据中分析挖掘实用、全面的信息,并通过数学知识建立模型,综合运用数据分析及挖掘技术,提炼能帮助进行复杂决策的价值信息,促进城市管理应用的知识发现,提升浙江省智慧城市建设的水平和效能.

2 聚类分析概述

聚类分析方法作为一种定量研究法,常用于探究庞大数据信息中所隐含的分类规则,以纯数据的视角,给出具有经验和更准确、细致的专业判断,也能够结合其他多种数据挖掘技术,找出更深层次的隐含信息,大大提高数据挖掘的效率和效应.聚类分析主要是对多个样本或多个指标进行定量分类的一种多元统计分析方法.其中对样本进行分类并命名为Q型聚类分析,另一种R型聚类分析则是对指标进行分类.聚类分析通过将数据分组成为多个簇,相似的数据对象构成同一聚类簇,不同簇中的数据相异程度较大.因此,最重要的聚类标准即为数据对象属性同簇相似、簇间相异.

首先需要将原始数据及数据标准化,一般给定具有m个指标的变量,进行n次观察,可以将某个样本的观测值看出Rm空间中的一个点,因此这n个样本就构成了Rm空间中的n个点,聚类的关键在于定义Rm空间中两个点xi等于(xi1,xi2,等,xim)和xj等于(xj1,xj2,等,xjm)的距离,Q型聚类分析常常采用 Minkowski距离或Euclidean距离,用于度量样本间的距离,其定义为:

Minkowski距离(p阶):

Euclidean距离(欧式距离),即当Minkowski距离p等于2时情形:

当空间中各指标存在相关性时,采用斜交空间距离或相似系数来度量两个样本直接的亲疏程度.主要用于指标变量的分类,即R型聚类采用.其相似系数主要为夹角余弦,其定义为:

夹角余弦:

在聚类分析的某个中间过程,当一个类别有两个及以上样本时,需要和另外的类聚成新的类,这就需要解决类和类之间的距离定义.这和前面的距离不一样,前面是空间中两个点的距离,而这里是两个类别之间的距离,类中的元素大于等于两个.

设两个类Gp和Gq中分别有S和t个样本,它们的重心是对应指标的平均值,分别记为和,两个类之间的距离用D(p,q)表示.常采用类间距离为组间平均法,即定义:

本文主要采取系统聚类和K-均值聚类进行数据分析.系统聚类主要将空间数据实体组成一棵聚类树,通过反复聚合或分裂获取满足条件的空间聚类结果.明确距离的定义选取欧式距离;确定类间的距离使用组间平均法.让每个样本自成一类,即n个样本共建立n个类.进而得n×n维的距离矩阵.通过矩阵合并最近距离的两个样本归纳一个新类,重新计算类别间的距离,得到新的距离矩阵,再重复直到所有类归为一类为止.K-均值聚类是最简洁和高效率的非系统聚类方法,先预设最终的分类数N0,随机生成N0个初始聚类中心点,通过设置最大迭代步骤和收敛误差标准,计算每个样本到聚类中心点的距离,以距离最小原则将全部样本划入N0个类中,此时聚类中心变成新的群中心,重复迭代直至聚类中心不再变化,或达到预设的最大迭代步骤和收敛误差标准时,终止计算.最终得到每个样本所属的类别和相应类别的聚类中心.

3 温岭市太平街道事部件数据分析

温岭市是浙江省为数不多的县级智慧城市建设试点市.太平街道为温岭市政治、经济和文化中心,下辖东辉社区、繁昌社区等14个社区,总面积为34.7平方千米,常住人口为9.6万人.

城市管理案件数据是温岭市太平街道 监督员巡查时上报的案件,现分析2014年全年数据,可以发现案件种类繁多,案件大类12种,属于事件类型的大类有6种,属于部件类型的有6种;每一大类又可分为种种小类,为简化指标,统计时按如下指标.

利用SPSS软件进行简易操作,其描述性统计见表2.

将数据标准化处理后进行系统聚类,得其平均连结(组间)和树状图分别见表3和图1.

进而采用K-均值聚类分析方法,得到分析结果,见表4、表5.

从聚类分析的结果可得,太平街道各社区城市管理现状存在较大的差异,事部案件发生数分布很不均匀.如果根据各社区城市管理状况把14个社区分为3类.第一类:东辉社区、繁昌社区、月河社区等10个社区.第二类:锦屏社区1个社区.第三类:方城社区、尚书房社区、西园社区等3个社区.

从以上结果结合聚类图中的合并距离可以看出第三类方城社区、尚书房社区、西园社区等3个社区城市管理总体情况优异,发生的案件数总体偏少;第二类锦屏社区发生的案例数偏多,应加派管理人员,重点监督;第一类东辉社区、繁昌社区、月河社区等10个社区情况总体相仿,应采取同一管理模式应对.

4 结 语

基于聚类分析的方法对智慧城市数据进行分析,实现从地理空间的角度,探究城市管理事部件产生的特征及规律,为城市管理中案件发生作出预警,为管理者提供决策依据,从而提升城市整体管理水平,促进智慧城市的健康发展和科学管理.

主要参考文献

[1]王静远,李超,熊璋,等.以数据为中心的智慧城市研究综述[J].计算机研究和发展,2014(2).

[2]司守奎,孙玺菁.数学建模算法和应用[M].北京:国防工业出版社,2013.

[3]魏海洋.城市案件空间聚类技术研究[D].北京:北京建筑大学,2015.

聚类论文参考资料:

聚类分析论文

a类期刊有哪些

机械类杂志

医药类期刊

国家级教育类期刊

交通类期刊

结论:基于聚类分析智慧城市事部件数据为关于聚类方面的论文题目、论文提纲、聚类算法论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。

和你相关的