分类筛选
分类筛选:

关于新思维论文范文资料 与大数据和统计新思维有关论文参考文献

版权:原创标记原创 主题:新思维范文 科目:技师论文 2024-02-24

《大数据和统计新思维》:此文是一篇新思维论文范文,为你的毕业论文写作提供有价值的参考。

摘 要:本文分析了大数据内涵及其给统计工作带来的新思维、新转变.通过大数据发展趋势信息,会产生危害社会进步的数据垃圾,作为数据科学的统计思维的进一步脱胎换骨地发展,从理论和实践上做出了论证分析,并且联系我国实际,探讨了我国大数据和统计设计理论和内容要点.

关键词:大数据 统计新思维

一、大数据内涵解析

不同行业、不同研究领悟的从业者对大数据的理解不尽相同,但是大数据不论从“大”的层面来看还是从“数据”的层面来讲都和传统的数据存在天差地远的区别,二者的区别不仅仅体现在体量上,更体现在数据内涵上.从统计学角度上来理解大数据的含义的话,大数据是建立在现代信息技术和手段基础上的连续的、扩充的数据形式,大数据在记录能力和存储能力上要远远超过传统数据,突破了传统数据固定、不连续、有限和不可扩充的局限性.简而言之,大数据是一切可以记录的符号的集合.

传统统计研究以有意收集的结构化样本数据为研究对象,当今统计研究面临的则是随时随地存储、动态扩充、无限容量的多类型数据.样本数据和大数据的区别在于样本数据是格式化数据,是按照研究目的和一定的抽样方法收集而来的,数据量相当有限,而在研究过程偏离预定方案的情况下,样本数据可能不再试用.根据样本数据进行的统计分析,适用空间也比较小,难以满足多角度、全方位的研究需要,当在研究中出现抽样方案未能预测到的情况时,样本数据不可扩充的缺陷就会直接暴露出来.大数据则不仅仅信息量大,而且在现代信息技术的支持下不受条框的限制,可以接纳任何种类的数据,也无法拒绝任何一个类型的数据.相较于样本数据而言,大数据具有无限大的选择空间,可以胜任多角度、多层次分析的要求.

二、大数据带来的统计思维的变化

(一)转变认识数据思维

从数据来源上看,传统数据收集目的性强,基本可以确定数据提供者的身份,一些数据还支持事后进行核对校正.但是大数据全部来自物联网,其产生之初就不是为了收集目的而存在,而是一切可记录符号的集合,识别数据提供者的身份是非常困难的,也就是说从微观层面追溯大数据的数据来源是不太现实的.

从数据类型上来看,传统数据具有很强的结构性,基本上都是定量数据加上一定形式的定性数据组成,具有一定的标准和格式,并以传统的统计指标和统计图表为格式展现出来.大数据具有非结构性、半结构性和异结构性特点,一切可记录的符号和信息都被其囊括其中,传统的统计指标和统计图表难以体现大数据的多样化和无标准性.另外,大数据产生于不同的网络信息系统,不同的系统之间对数据的分类并不存在统一的标准.现有的数据库本身就是非关系型数据库,在包容多种多样的大量数据的时候不需要对数据的记录结构进行预先的设置.

从数据量化的层面来看,传统数据在多年的统计分析之中已经形成了相对完善和规范的数据量化方式和过程,量化之后的数据基本可以直接运用于数据分析和计算.但是大数据的非结构性使得对其的量化方式、提取方式、如何对接到结构性数据之中成为一个崭新的问题.任何统计分析都难以直接分析非结构化的数据,更不用说从非结构化的数据中得到科学正确的统计结论,在大数据统计工作中,量化的含义本身也发生了变化,对量化结果的呈现形式也不再统一和规范.由此可见,大数据下的非结构化数据不再试用传统的数据结构方式.

(二)转变收集数据思维

统计分析以收集数据为前提,没有经过收集数据过程的统计分析无异于缘木求鱼.传统统计分析中首先要确认分析的目的然后再进行数据收集,并对调查方案或者抽样方法进行精心设计,这个过程中需要消耗大量的时间和精力.大数据出现之后,我们就拥有了大量可供选择的数据,统计分析的对象在种类和体量上都获得大大的提升,所以统计分析工作的重点就转变为选择和比较,收集数据的思维也就转变为如何充分利用大数据,不必要对大数据中能够找到的数据进行专门的调查和收集.

但是,鉴于大数据来源多样、种类繁杂,数据增加速度很快,统计分析在感受数据丰富性的同时也需要思考这样一个难题:存储能力不足、分析能力较差、数据真伪鉴别能力有待提升、关联物选择不佳等等.目前TB级别的数据库已经屡见不鲜,PB级别的数据也已经渐渐盛行,将来甚至可能出现EB、ZB和YB级的数据,电子储备能力的提升已经迫在眉睫,如果数据库不能自动更新就可能会影响到大数据的运用,加之数据库的自动更新还可能会导致数据的丢失和遗漏.在数据库达到一定级别之后进行容量扩充或者数据拷贝的时候,代价是非常惨重的,所以在必要的情况下我们必须对数据库进行筛选和分类,针对性删除一些不重要的数据或者垃圾数据.传统统计分析中中针对性获取数据成为数据收集,当今对大数据进行选择性地删除在本质上也属于数据收集.大数据时代的数据收集理念已经转变为从超大量数据中进行过滤和再次选择,大数据时代意味着我们必然会舍弃一部分数据.

(三)转变数据分析思维

首先,传统统计分析过程从定性分析开始,然后进行定量分析,最后再归回到定性分析.开始的定性分析是为了给定量分析找到要点和方向,此时分析者的经验和能力成为统计分析质量的决胜因素,因为在数据缺失和分析运算方法有限的情况下,高质量的定性分析决定了统计分析的优劣好坏.而当前我们可以依赖大数据进行判断和决策,当今时代计算机技术、分析技术、存储能力大大提升,定量的回应已经不可避免地走上简单化趋势,而统计分析工作要做的仅仅是从定量的回应之中挖掘出和统计分析目的相符的数量关系和数量特征,从而为科学、合理的决策提供依据和数据支撑.大数据背景下的统计分析只经历定量到定性的环节和步骤,得出的定性结论更具可靠性和准确性.

其次,传统的实证分析工作从提出研究假设开始,然后通过收集数据和分析数据来验证假设是否成立,这种实证分析方法受到假设本身的科学性、指标选择的恰当性和数据的完整性影响,稍有不当就有可能得出错误的结论.尤其是当假设本身不科学的时候,那么这个实证研究都变得毫无意义,甚至会歪曲事实.所以在传统的实证分析中,通常都是分析过程去迎合假设结论,科学研究走上歧途之路.大数据时代背景下的实证分析已经不再受到假设的限制,能够自动地发现规律、找到关系,然后再据此进行归结和总结,形成最终的结论,在这种情况下实证分析的思路转变为发现—总结,统计分析能够得到资源和空间上的极大扩展,很多以前没有发现的规律被意外发现.

新思维论文参考资料:

新课程编辑部

新课程刊物

新经济杂志

农村新技术杂志

新课程导学期刊

新制度经济学论文

结论:大数据和统计新思维为关于对不知道怎么写新思维论文范文课题研究的大学硕士、相关本科毕业论文新思维教育论文开题报告范文和文献综述及职称论文的作为参考文献资料下载。

和你相关的