分类筛选
分类筛选:

关于贝叶斯统计论文范文资料 与基于上市企业财务数据贝叶斯统计和知识推理有关论文参考文献

版权:原创标记原创 主题:贝叶斯统计范文 科目:毕业论文 2024-03-25

《基于上市企业财务数据贝叶斯统计和知识推理》:本论文可用于贝叶斯统计论文范文参考下载,贝叶斯统计相关论文写作参考研究。

【摘 要】本文主要使用matlab和R自带软件包对上市企业财务数据建立贝叶斯网.用matlab对建立好的贝叶斯网络进行参数学习,利用多种推理引擎进行精确推理,并对结果进行比较分析.

【关键词】贝叶斯网 精确推理 财务数据

一、引言

在上个世纪80年代以前,人工智能学术界普遍认为用概率论的方法来处理较大规模不确定问题是不切实际的,因为它在计算上太復杂,使其没有现实价值.然而,随着人工智能的不确定性问题专题会议的召开,研究者提出几种概率近似的变换方法,特别是贝叶斯网络等概率模型在实际中成功地应用(如专家系统和故障分析系统等),使贝叶斯技术被确立为处理不确定性问题的一种主要技术.但是关于贝叶斯网络的学习和推理还存在一些理论和应用方面的问题,随着今二十年的研究深化,这些问题逐步解决,贝叶斯网络已成为当前一种重要的智能化数据分析和处理工具.贝叶斯网络和其他数据挖掘方法(如决策树,神经网络,关联规则等)相比,贝叶斯网络有以下特点:贝叶斯网络可以表示变量间的因果关系,这种联系的置信度是以概率的形式来表达;贝叶斯网络能够充分利用专家经验和样本数据的信息;贝叶斯网络能够方便处理有缺失值的数据;贝叶斯网络具有灵活的双向推理能力,能够有效避免数据的过度拟合和局部最优的问题.

二、数据处理

133只股票、31个因素变量的4年数据记录,共532条记录.其中符号表示的含义如表2-1所示.

为唯一标识每一股票数据,对股票重新编号,作为一个股票数据编号.如,第一只股票2003年的数据赋予编号1,第一只股票2002年的数据赋予编号2,以此类推.

首先对数据进行类型一致化和归一处理,在本文把极小型、居中型和极大型的变量统一化成极大型,下面是对每种类转计算公式:

把极小型指标转化为大的计算公式:

其中M是变量x的最大值.

把中间型指标转化为极大型指标的计算公式为:

其中m、M分别是变量x的最大值和最小值.

然后“标准化”处理法.即取

其中Xij为标准观测值,其平均值和均方差分别为0和1.式中j(j等于1,2,...,31)为第j项指标原始观测值的平均值,Sj(j等于1,2,...,31)为第j项指标原始观测值的均方差.

不考虑变量为连续性的情况,所以必须把是连续型通过离散化处理变成离散型的变量,在这里我们通过等距对数据进行把每一个连续性的变量离散出三值1,2,3,最后经过类型一致化、标准和离散化处理数据.

三、贝叶斯网络的构建

(一)K2法建立贝叶斯网络结构

Matlab中的贝叶斯网络工具箱(BNT)提供了丰富的参数学习函数,K2是其中的一种.函数调用如下:

data等于xlsread("课程论文.xlsx");

data_train等于data";

N等于size(data,2);

ns等于3*ones(1,N);

order等于[19 24 25 29 23 28 13 18 14 20 22 30 10 11 12 8 16 9 4 1 2 3 5 31 17 6 7 15 21 27 26];

max_fan_in等于4;

discrete_nodes等于1:N;

dag_K2等于learn_struct_K2(data_train,ns,order,"discrete",discrete_nodes,"max_fan_in",max_fan_in);

建立的结构图如下图所示:

(二)爬山法建立贝叶斯网络结构

Matlab同时也提供爬山法学习函数learn_struct_hc(),所有条件都采用默认条件,调用形式如下:

data等于xlsread("课程论文.xlsx");

data_train等于data";

N等于size(data,2);

ns等于3*ones(1,N);

dag等于learn_struct_hc(data_train,ns);

dag_pashan等于dag;

建立的网络结构图如下:

R软件也提供贝叶斯网络结构的学习,下面是采用R中的爬山法建立的贝叶斯网络结构.

在使用matlab和R两种软件辅助建立贝叶斯网络结构中,均采用爬山法,默认条件下,R的结构学习时间大大小于matlab的结构学习时间,其中R只需要几秒钟的时候,matlab却用了2个多小时.

(三)贝叶斯网络的精确推理

为了提高运算速度,使各种推理算法能够有效应用,BNT工具箱采用了引擎机制,不同的引擎根据不同的算法来完成模型转换、细化和求解.这个推理过程如下:

BNT中提供了多种推理引擎,都有:

1.不同推理引擎对K2法建立贝叶斯网的精确推理比较.

使用软件是matlab,以K2法建立的贝叶斯网络结构进行精确推理,采用不同的参数学习和推理引擎,结果如下表所示:

2.不同推理引擎对爬山法建立贝叶斯网的精确推理比较.

使用软件是matlab,以爬山法建立的网络结构进行精确推理,采用不同的参数学习和推理引擎,结果如下表所示:

3.贝叶斯网的精确推理结论.

由表3-5至3-7可以看出,matlab中提供的推理引擎,联合树推理引擎比较实用,适用于各种推理.通过统计样本数据,发现当证据变量为查询变量的父节点或者祖父节点时,适用联合树推理引擎的极大似然估计推理出来的结果和统计样本得到的结果一致.

四、结论

(1)在网络结构学习中,运用爬山法在不同软件辅助学习中,所用时间不同,matlab用时远远多于R.

(2)不同算法学习得到的网络结构不同.在同种算法学习中,使用不同软件,学习结构也不太一样.

(3)在使用matlab提供的推理引擎,当证据变量为查询变量的父节点或者祖父节点时,适用联合树推理引擎的极大似然估计推理出来的结果和统计样本得到的结果一致.

参考文献

[1]茆诗松.贝叶斯统计[M].北京:中国统计出版社.1999.

[2]严慧鑫.贝叶斯网精确推理算法的研究[D].吉林:吉林大学,2006.

[3]余申庆.基于条件独立性测试的贝叶斯网构建以及对股票数据的应用分析[D].广东:华南理工大学,2015.

[4]Pearl J F,propagation and structuring in belief networks[J].Artificial Intelligence,1986,29(3):241-288.

[5]Lauritzen S L,Spiegelhalter D J. Localcomputations with probabilities on graphical structures and their applications to expert systems[J]. Proceedings of the Royal Statistical Society,1988,B(50):154-27.

[6]张燕.基于图模型分解的贝叶斯网络学习和推理研究[D].西安:西安电子科技大学,2014.

[7]杨海深.贝叶斯网络中不确定性知识推理算法及其应用研究[D].广东:华南理工大学,2010.

[8]王建康等.混合分布理论及应用[J].生物数学学报,1995,10(3):338-353.

[9]张连文等.贝叶斯网引论[M].北京:科学出版社.2006.

[10]廖芹.数据挖掘和数学建模[M].北京:国防工业出版社.2010.

贝叶斯统计论文参考资料:

统计论文

多元统计分析论文

统计源期刊医学

统计源期刊

小福尔摩斯杂志

统计源期刊是什么意思

结论:基于上市企业财务数据贝叶斯统计和知识推理为关于本文可作为相关专业贝叶斯统计论文写作研究的大学硕士与本科毕业论文贝叶斯统计 茆诗松 pdf论文开题报告范文和职称论文参考文献资料。

和你相关的