关于宏观经济论文范文资料与基于LARS—Lasso算法宏观经济相关性支付指标挑选有关论文参考文献-论文写作网

《基于LARS—Lasso算法宏观经济相关性支付指标挑选》：本文是一篇关于宏观经济论文范文，可作为相关选题参考,和写作参考文献。

摘要：支付系统是经济运行的载体,其支付指标能先行反应宏观经济的运行态势.在宏观经济分析中,传统的OLS（最小二乘）多元线性回归分析方法不能剔除无关和重复的数据,存在严重多重共线性问题,从而使预测精准度下降、拟合优度较低,同时也加大了数据统计工作量.为了提高分析的精准度和效率,本文选取基于R语言的预测精度高、复杂度低的LARS-Lasso算法,用于挑选核心指标集,以达到挖掘核心、精炼模型的目的.

关键词：央行支付系统；LARS-Lasso；支付指标挑选；多元回归分析

基金项目：2016年上海市级大学生创新活动计划项目“后市研判的大数据分析和数学建模”（SJ2016099）.

引言

央行支付系统是我国社会资金运动的中枢,时刻记录着全国各地几乎所有形式的支付行为,为我国经济平稳运行和社会健康发展提供了坚实的基础.我国一直重视支付清算服务的全面性、灵活性、快捷性、安全性发展.2015年,中国人民银行搭建了一个较为成熟的支付系统信息网络平台,平台记录全面覆盖了我国各地各类支付信息,追踪着资金流转的实时情况,为支付系统指标数据的提取和宏观经济分析提供了极大便利.

支付结算体现了单位、个人在社会经济活动中使用票据、、汇兑、托收承付、委托收款等结算方式进行货币给付及其资金清算的行为,其功能是完成资金从一方当事人向另一方当事人的转移.简单细分,支付结算涵盖了结算和银行转账结算.这些支付结算的大数据在支付信息平台中通过一系列的指标来反应经济运行信息.由于支付系统信息量大,其中数据细分存在着大量的交叉和重复,会导致降低应用支付系统分析经济运行形势的准确率.

支付信息不仅仅和资金流转之间有直接的相关性,也和国民经济运行的重要宏观经济指标如GDP等有着非常紧密的内在联系,通过对支付系统指标数据的分析及变动预测,可以清楚了解到国民经济总体运行情况以及发展趋势.而面对如此多种、海量的支付信息数据,其和宏观经济之间的相关性无法从表面观察得知.如何合理地处理、挑选支付系统核心指标,对于运用支付系统分析宏观经济运行形势具有重大的现实意义.本文将支付系统支付指标和宏观经济相关性问题转化为多元线性回归问题,并运用预测精度高、复杂度低的LARS-Lasso算法,基于R语言对其相关性进行挖掘分析.

一、支付系统指标体系的选取

(一)指标选取的原则

指标选取的原则要具有以下四个方面要素：第一,代表性和广泛性,所选指标能代表或反映行业的经济运行状况,能够代表经济活动的主要方面；第二,相关性和灵敏性,指标的变动和经济的波动密切相关,指标能够灵敏的反映基准循环指标的变化；第三,可得性和时序性,指标数据能通过相关部门便捷的获取,并有连续性；第四,数据充足性和规律性,样本数据达24个月以上,并且数据应体现经济内在的规律.

目前我国的支付清算体系主要是以中国人民银行大、小额支付系统为核心,银行业金融机构行业内业务系统为基础,票据支付系统、支付系统和境内外币支付系统为重要组成部分.根据上述原则本文初步选出了16个支付信息自变量指标,具体如下：

(二)LARS-Lasso指标挑选算法简述

根据上述选取原则初步筛选所得的16个指标,具有较多的主观因素,且存在着数据的交叉和重复,由于OLS（最小二乘法）难以剔除无关变量、无法识别指标共线性问题,本文考虑将求解支付信息指标选择问题转化为在OLS问题基础上增加了一个l1范数作为罚约束项的Lasso问题.求解该Lasso问题时,本文选取的LARS算法,通过定义指标间“角分线”逐步将相关指标加入回归模型中,使其具有下述2个特性：（1）将指标逐个加入回归模型,使得算法最多只需要（所考虑的指标总数）步,避免了前向梯度算法的选取重复性,继而降低了算法复杂度；（2）“角分线”法不像前向选择算法那样一次一步使用某项指标到底,其基本思想和前向梯度算法的逐步逼近相类似,因此不会遗漏相关信息,能够得到最优解.此外,考虑到实际支付信息指标贡献度的非负性,本文采用非负Lasso问题,同时对其相应的LARS算法进行了非負修改,最终得到本文的LARS-Lasso算法指标选取模型.

二、 LARS-Lasso算法具体设计

(一)多元线性回归问题一般方法——OLS（最小二乘法）

对于响应变量和个自变量的多元线性回归问题,其回归模型表示为：

假设已有试验样本数据（xi1,xi2,...xip,yi）,i等于1,2,...n,则回归分析主要问题是估计回归系数βj,j等于1,2,...,p.

1.OLS回归过程

OLS回归思想本质是对于上述多元线性回归问题,求得回归系数的估计,使得其使回归方程和所有样本观测值Yi（i等于1,2,...,n）的RSS（残差平方总和）最小化：

2.OLS模型分析支付信息数据的局限性及改进方法

对于较为复杂的多元线性问题,若待分析的p个自变量和响应变量y之间线性相关程度较高,则OLS估计的回归方程RSS往往较大,预测精度下降明显；且对于所选取的p个自变量,其互相之间常具有共线性性,如本文所选取的16个支付系统指标之间明显存在共线性、甚至相包含的关系（如票据业务总量和商业汇票承兑、贴现业务总量）,这使OLS模型增加了不必要的复杂度.此外,在初步选取指标时,由于希望把可能的所有变量纳入考虑范围,模型中常常存在一些和响应变量无相关关系或相关程度趋于0的自变量,这些无用的自变量不能被OLS方法识别并剔除,这也会使模型精度下降,降低回归方程的解释能力.因此,OLS对于复杂的多元线性回归问题已经不再适用.

在OLS基础上,针对其上述几点缺陷,优化OLS的目标主要是平衡拟合过度和不足,改进方法可分为两类：（1）变量选取,以经典的主成分分析和因子分析为代表；（2）正则化,以Lasso（Least absolute shrinkage and selection operator的缩写）和岭回归（Ridge Regression）为代表.其中主成分分析和因子分析方法虽在多数情况下可得到稳定模型,但当自变量指标样本矩阵X值使得X’X为几乎奇异阵,即,自变量指标样本选取稍有不同,将导致X’X发生显著变化,这显然会影响模型稳定性,继而削弱模型预测精度.同样情况下,Lasso和岭回归方法引入的参数λ能够很好地弥补这一缺陷.但岭回归由于罚约束项使用的惩罚约束项为l2范数形式,使得自变量估计系数无法等于0（λ有限时）,这一误差虽不会对模型精度产生过大影响,但非0系数使得模型本质上并未真正达到变量选择的目的,即解释能力仍较低.而和此同时,Lasso使用的l1范数能够克服此问题,模型压缩效果更好.

宏观经济论文参考资料：

结论：基于LARS—Lasso算法宏观经济相关性支付指标挑选为关于宏观经济方面的论文题目、论文提纲、宏观经济分析论文开题报告、文献综述、参考文献的相关大学硕士和本科毕业论文。