基于SPSS的北京房价影响因素分析的讨论

一.讨论背景

在经济高速发展当今时代,房价问题一直是所有人关注的重点问题。我国房地产事业从20世纪年代开始建立到如今,作为民经济新的增长点,为中国经济的快速增长做出了贡献 对我国的经济增长产生了很大的影响,一度影响着国家经济的发展快速与否。然而房地产事业在为国家做着贡献的同时,又存在着许多令政府和群众堪忧的房价问题。近年来,房价的飞速涨,房地产的飞速发展一直在政府和群众的关注之下。其带来的一系列问题将对房地产行业的良性发展、政府的调控能力以及国民经济的可持续发展带来影响。因此研究对住宅商品房价格的影响因素,有助于在事实的基础上,一定程度地把握房地产市场的发展规律,这对整个国家经济的发展具有很大的意义。本篇课题主要以北京为中国房地产市场的代表城市进行分析,通过对历年的相关经济数据整理分析建立起相关模型。通过在网络上搜索可以知道,从理论上来讲,房价的波动主要受政府的一系列政策、市场和资金、土地和房产以及房地产企业和购房人等指标因素的影响。本PPT中主要选取住宅商品房平均小区售价作为因变量。

SPSS(Statistical Product and Service Solutions),“统计产品与服务解决方案”软件。最初软件全称为“社会科学统计软件包”(SolutionsStatistical Package for the Social Sciences)具有完整的数据输入、编辑、统计分析、报表、图形制作等功能。自带11种类型136个函数。SPSS提供了从简单的统计描述到复杂的多因素统计分析方法,比如数据的探索性分析、统计描述、列联表分析、二维相关、秩相关、偏相关、方差分析、非参数检验、多元回归、生存分析、协方差分析、判别分析、因子分析、聚类分析、非线性回归、Logistic回归等。

二.数据搜集与整理分析

本文中所用数据均来源于百度,该数据拥有小区名称,小区所属区域,具体区域商圈,户 型,成交面积,成交价格,挂牌价格,朝向,装修,调价,关注度,房源详细信息,楼层,年代,带看次数,成交周期,成交日期,小区地址,小区均价,附近链家门店,小区总户数,小区总栋数,小区开发商,小区物业公司,物业费,小区结构,建筑年代等多项信息。选取住宅商品房平均销售价格为因变量来进行分析,来讨论这些因素对房价的影响。

我们对数据进行了一些筛选,得到有效数据比例如图所示:

imgimg

三 模型的建立分析

以小区均价为因变量,分别查看在不同因素下房价的变化走向。如果在其他因素相同情况下,某一因素变化,房价会有显著变化,那么它就是对房价影响的主要因素之一。基于这一理念,我们使用SPSS建立了一系列模型进行分析。

img

第一张图为模型摘要,图中用进度条图来展现模型拟合效果。它类似于普通线性回归中的决定系数。一般模型准确度大于70%就算拟合不错,此模型达到81.8%,效果不错。

img

第二张图是建模的自动准备数据过程信息,比如各个变量的角色,对其进入模型之前都做了哪些处理操作。

img

第三张图为预测变量最重要性图,从图中可以看出,具体区域商圈重要性最大,年代重要性最小。

img

第四张图是预测—实测散点图,也就是预测值和实际因变量绘制的散点图,横轴为实际因变量值,纵轴为预测值。用于考察预测效果,如果效果好。数据点应该是一条45°线上分布,如图预测效果一般。

img

残差在数理统计中是指实际观察值与估计值(拟合值)之间的差。“残差”蕴含了有关模型基本假设的重要信息。如果回归模型正确的话, 我们可以将残差看作误差的观测值。残差是预测值与实际值之间的差,残差图用于回归诊断,判断当前模型是否满足回归模型假设,此图接近正态分布曲线,满足回归模型假说。

img

离群值(outlier),也称逸出值,是指在数据中有一个或几个数值与其他数值相比差异较大。chanwennt准则规定,如果一个数值偏离观测平均值的概率小于等于1/(2n),则该数据应当舍弃,此图为强影响点的诊断,相应库克距离越大,对回归拟合影响程度越大。

img

此图为回归效果图,用于展现比较各个自变量对因变量的重要性,同样为具体区域商圈最重要,年代最不重要。

img

年代和小区均价成线性关系,未来几年的房价可能是越来越高。

img

由图可知朝向对小区均价影响不是很大,图中出现奇异点,分析原因可能是数据不准确、出现缺失。

img

由图可知东城房价最高,丰台最低,地域对房价的影响还是比较显著的。

img

img

img

img

img

img

这些图是自变量和因变量绘制的均值,用直观的图形帮助我们研究因变量与自变量之间的关系,由图可以看出,年代和具体区域商圈与房价之间存在一定线性关系。

四.结论

通过对这些模型的分析,我们得出了以下结论:

①小区所属具体区域商圈不同,小区均价具有很大变化,也就是说小区所在地区及具体商圈是影响房价的最重要因素不同区域的房价。

②由饼图可以看出,不同装修程度房价有所不同,房子的装修程度也是影响房价的因素之一。

③此外,房价近几年有逐年上升趋势,户型和装修程度对房价有一定影响,房子朝向对房价影响不大。

五.结论

①.通过这段时间对大数据及相关软件的学习,加深了对大数据的理解以及提高了在以后的学习当中能用大数据的相关知识解决问题能力。

②.在对相关软件的运用中进一步理解相关术语的意思,知道了离群值、库克距离、残差的意思。

③.未来大数据的应用会越来越广,有必要掌握与发展一定的大数据知识及技能。

  • 6
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值