分类筛选
分类筛选:

关于决策树论文范文资料 与基于决策树住房租赁价格微观影响因素有关论文参考文献

版权:原创标记原创 主题:决策树范文 科目:职称论文 2024-04-10

《基于决策树住房租赁价格微观影响因素》:这是一篇与决策树论文范文相关的免费优秀学术论文范文资料,为你的论文写作提供参考。

[摘 要]随着我国经济水平飞速增长,城市间人口流动日益频繁,房屋租赁市场日趋繁荣,房屋的租金也受到越来越多的关注.而由于互联网的发展,房东和租户通常会在网络上发布并获取信息,因此租房网站中包含丰富的租房信息.文章利用网络爬虫技术从租房网站收集了北京市各区域共计三千余条租房信息,并将住房租赁价格作为被解释变量,并选择6个微观因素作为解释变量,基于特征价格理论建立决策树模型,分析影响租房价格的关键因素,并为住房租赁价格定价及预测提供新的思路.

[关键词]住房租赁价格;微观影响因素;决策树

[DOI]1013939/jcnkizgsc201717037

1引言

作为房地产市场体系两个必不可少的重要组成部分,租赁市场和买卖市场,和北京市房地产市场的健康平稳运行有着密切的关系.持续提高的城镇化水平意味着将有相当数量的农村剩余劳动力及人口转移到城市.北京地区的高房价客观上也使购买商品房需要大量的资金.因此,越来越多的人选择暂时放弃购房需求,并将目光由买卖市场转向租賃市场,借助租赁市场将自身的住房需求解决.在此背景下,住房租赁价格由哪些因素确定成为了学者关注的问题.

目前,已有大量学者对此进行了研究.Marks(1984)用特征价格指数对温哥华租赁住宅数据进行研究,结果发现停车位提供、自动洗衣店等相关变量均显著影响住宅租金.Guntermannn(1987)的研究表明,游泳池、健身房的存在对租金有着显著影响.此外,许多学者将研究重心放在配套设施对住宅的影响.George(1985)、Sirmans(1990)等则对住房内的配套设施,如电视、洗衣机等对租金有正方向的影响作用.然而,住宅由于其私密性等问题,传统的入户调查方法成本较高且难以获得较大数据.从国内文献看,学者大多集中在微观因素对写字楼等商用房屋租赁价格影响的研究.聂冲(2009)研究发现区位、建筑、商铺和租约特征都是购物中心商铺租金的重要决定因素,但相对而言,区位特征最为重要.梁艳(2011)选取深圳市场上能获得数据的四类20个解释变量进入租金模型.采用特征模型,对深圳市114栋写字楼的要价租金均价进行回归分析,并发现大部分特征因素对写字楼租金有显著影响.全百松(2013)通过构建写字楼特征价格模型,发现不同城市发展水平下的写字楼租金影响因素在显著性及影响系数两方而表现不同.

然而,由于住宅私密性等问题,传统的入户调查方法成本较高且难以获得较大数据,若要避免入户问题则只能对写字楼等开放区域进行调查.为弥补此缺陷,本文通过网络爬虫技术获取到北京市住房租赁价格相关数据,可以在较短时间内获得丰富的租房微观数据.此外,本文通过建立决策树模型对北京市住房租赁价格进行分析,可利用决策树的优势对住房租赁价格的微观影响因素进行深入分析,从而使各类租房人群能结合自身对房屋的需求,借助模型估算参考价格,同时对当地房地产 机构合理评估住房租赁价格有一定的参考借鉴意义.

2理论基础

21特征价格模型理论

特征价格模型来源于特征价格理论.A T Court(1939)首次对汽车价格进行了研究,认为汽车价格是由汽车本身特征决定,并构建了汽车价格指数.随后,Lancaster(1966)提出消费者偏好理论,认为消费者购买一个产品,是由于产品的特征符合消费者的需求.Rosen(1974)则完善了Lancaster偏好理论,理论上构建了特征价格供需特征模型,为特征价格模型奠定了基础.该理论认为,住房价格是由住房特征带给人们的效用决定的,由于住宅特征的数量及组合方式不同,使得房地产的价格存在差异.因此,本文根据特征价格理论对住宅租赁价格的影响因素分解,分析各因素对房租的影响.

22决策树理论

本文主要采用决策树方法进行建模.决策树是一种监督式的学习方法,产生一种类似流程图的树结构.决策树对数据进行处理是利用归纳算法产生分类规则和决策树,再对新数据进行预测分析.树的终端节点——叶节点(leaf nodes),表示分类结果的类别(class),每个内部节点表示一个变量的测试,分枝(branch)为测试输出,代表变量的一个可能数值.为达到分类目的,变量值在数据上测试,每一条路径代表一个分类规则.

在树的每个节点上,使用信息增益选择测试的变量,信息增益是用来衡量给定变量区分训练样本的能力,选择最高信息增益或最大熵(entropy)简化的变量,将之视为当前节点的分割变量,该变量促使需要分类的样本信息量最小,而且反映了最小随机性或不纯性(impurity)(Han和Kamber,2001).若某一事件发生的概率是p,令此事件发生后所得的信息量为I(p),若p等于1,则I(p)等于0,因为某一事件一定会发生,因此该事件发生不能提供任何信息.反之,如果某一事件发生的概率愈小,不确定性愈大,则该事件发生带来的信息愈多,因此I(p)为递减函数,并定义I(p)等于-log(p).给定数据集S,假设类别变量A有m个不同的类别(c1, 等, ci, 等, cm).利用变量A将数据集分为m个子集(s1, s2, 等, sm),其中si表示在S中包含数值ci中的样本.对应的m种可能发生概率为(p1, 等, pi, 等, pm),因此第i种结果的信息量为-log(pi),则称该给定样本分类所得的平均信息为熵,熵是测量一个随机变量不确定性的测量标准,可以用来测量训练数据集内纯度(purity)的标准.熵的函数表示如下式:

I(s1, s2, 等, sm)等于-[DD(]m[]i等于1[DD)]pilog2(pi)

其中pi是任意样本属于ci的概率,对数函数以2为底,因为信息用二进制编码.变量分类训练数据集的能力,可以利用信息增益来测量.算法计算每个变量的信息增益,具有最高信息增益的变量选为给定集合S的分割变量,产生一个节点,同时以该变量为标记,对每个变量值产生分枝,以此划分样本.再根据变量的不同值建立树的分枝,每个分枝子集中重复建树的下层结果和分枝的过程,一直到完成建立整株决策树.

决策树论文参考资料:

领导决策信息杂志社

决策杂志社

驳论文树靶子

结论:基于决策树住房租赁价格微观影响因素为关于本文可作为相关专业决策树论文写作研究的大学硕士与本科毕业论文决策树例题经典案例280论文开题报告范文和职称论文参考文献资料。

和你相关的