武汉二手房市场现在怎样了?涨了还是跌了?分析下武汉二手房数据

221 篇文章 46 订阅

一、背景与挖掘目标

经常听到这么一句话“坐拥百万大学生,武汉却留不住人。”,在人才竞争的大背景下,武汉出台了一系列包括“人才租房、购房8折优惠”等政策。“将武汉打造成大学生最友好城市”“5年内留住100万大学生”。

作为武汉百万大学生之一的你,是否考虑未来在武汉买房呢?

那么武汉的二手房市场又是怎样的呢?我们用Python来分析下武汉的二手房数据。

PS:如有需要Python学习资料的小伙伴可以加下方的群去找免费管理员领取

 

可以免费领取源码项目实战视频PDF文件

 

二、采集器获取数据

这次小编没有用python爬虫代码来爬取数据,用后羿采集器来爬取武汉二手房网上的数据,共获取5015条记录。

 

数据读入

先导入要使用的数据处理包pandas,可视化工具pyecharts、stylecloud。

 

导入CSV文件,预览数据。

 

从获取的数据来看,需要对数据进行预处理,缺失值和异常值检测,删除无用的列,进行数据类型的转换,提取关键字等操作。

数据整理

此处我们主要对以上获取的数据集进行部分清洗工作以方便后续的处理:

    title:作词云图
    list-info:地区、室、厅、面积、方位、楼层
    tag_info:提取是否靠近地铁
    total_price:提取房屋总价
    unitPrice:房屋单价
    picNum、jjrinfo、jjrname-outer、
    icon-anxuan-img:无用值无需分析,删去

提取关键数据:

 

数据类型转换:

 

处理后数据:

 

数据可视化

数据可视化部分主要对以下的数据进行汇总分析,分析维度以及代码如下:

  1. 武汉不同区域的二手房房源数量
  2. 武汉不同区域二手房平均价格
  3. 武汉二手房都处在什么价位
  4. 是否靠近地铁和房屋单价的关系
  5. 不同朝向的房屋数量分布
  6. 房屋面积和房屋价格的关系
  7. 卧室数量和房屋价格的关系
  8. 客厅数量和房屋价格的关系
  9. 二手房信息词云图

武汉不同区域的二手房房源数量

 

武汉不同区域二手房平均价格

 

武汉二手房都处在什么价位

 

是否靠近地铁和房屋单价的关系

 

不同朝向的房屋数量分布

 

房屋面积和房屋价格的关系

 

客厅数量和房屋价格的关系

 

二手房信息词云图

 

三、可视化分析

1. 武汉不同区域的二手房房源数量

那么武汉各个区域的二手房源分布如何呢?

 

获取的5014条数据中,经过统计可以看到,江夏区的二手房数量遥遥领先,达到997。其次是洪山区,共870。之后黄陂、汉阳、东西湖

2. 武汉不同区域二手房平均价格

不同区域的二手房价又是怎样的呢?

 

武昌区一马当先,以25518.24元每平米的价格领跑武汉的二手房市场。其次,江岸区以23190.4每平米排在第二位。江汉区以22921.04每平米的价格排在第三位。

3. 武汉二手房都处在什么价位

那么在武汉买一套二手房到底要花多少钱?

 

接着我们分析了二手房的价位,从图中可以看到总价在100-300万内的最多,占比达到76.44%。100万的占比18.23%。300万-500万的占比4.14%

4.是否靠近地铁和房屋单价的关系

 

一般来说,靠近地铁越近的房子房价越高,从分布的箱线图可以看出,以中位数来看,靠近地铁的房子单价比不靠近地铁的房子每平米高4254元。

5.不同朝向的房屋数量分布

 

房屋朝向方面,朝南北的自然是最多的,占比达到79.88%。其次是朝南的,占比15.33%。

6.房屋面积和房屋价格的关系

 

从散点图可以看出,房屋的面积和房屋价格呈现正相关,计算皮尔逊相关系数的值为0.67,为强相关。

7.客厅/卧室数量和房屋价格的关系

 

 

从分布的箱线图可以看出,卧室数量越多,面积越大,则房屋总价越高。房价呈现右偏分布,且离群值较多。客厅和卧室一样反映在房屋的面积上,客厅数越多,则房屋总价越高。

8.二手房信息词云图

 

简略的分析就到这里了。武汉最近几年的飞速发展,城市环境和交通都有质的飞跃,在武汉买

本文的文字及图片来源于网络,仅供学习、交流使用,不具有任何商业用途,版权归原作者所有,如有问题请及时联系我们以作处理。

作者:Nothing to lose921

### 安居客出租房(武汉为例)爬虫+数据分析+可视化 这个爬虫是我前段时间在淘宝上做单子的时候遇见的一个客户需求。本来以为就是一个简单的爬虫项目。但后面客户加了数据清洗和数据分析的要求。而后又加了要详细代码解释的需求等等。直到最后客户坦白说这是他们大专的毕设.......但是这个单子坐下来只有200左右,我想了一下,感觉好亏啊。在淘宝上随便找一个做毕设的都要好多钱的,而且客户本身的代码能力、数学、逻辑能力都很差,导致我每行都给注释以及看不懂,在我交付代码后又纠缠了我一个多礼拜。反正总体做下来的感觉就是烦躁。头一次感觉到了客户需求变更带来的巨大麻烦。 总之这是一次不是很愉快的爬虫经历。但是作为我写爬虫以来注释最详细的一次,以及第一次真正使用像matplotlib这种数据分析库的代码,我认为还是有必要分享出来给大家当个参考的(PS:大佬轻拍~)。爬虫本身几乎没有什么难度,写的也比较乱,敬请见谅。 **功能** 爬取安居客上的出租房信息(武汉地区的),并通过爬取的数据进行数据清洗以及数据分析。给出四个不同层面的可视化图。最终结果如下图所示: ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/1.png) ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/2.png) ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/3.png) ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/4.png) **环境** 1. Windows 10 2. python3.7 **使用方法** 首先声明该爬虫由于是特定情况下写的,所以本身的通用性特别差,仅可以对安居客网站上的武汉的出租房信息进行爬取,且需要自己手动更新cookie。同时在对数据进行分析可视化的时候由于也是特别针对武汉出租房的进行的,所以针对性也比较强。如果别的需求需要自己进行更改。 1. 访问[安居客网址](https://wuhan.anjuke.com/),获取cookie。 > tip:获取cookie的方法可根据[此链接](https://jingyan.baidu.com/article/5d368d1ea6c6e33f60c057ef.html) 2. 在项目中找到`spider.py`的文件,将第12行的cookie换成你自己的cookie。 3. 运行`spider.py`,获取房源信息。运行后应会产生一个`武汉出租房源情况.csv`的文件。此文件为我们从安居客上爬取的房源信息,其中包含`房屋租住链接、房屋描述、房屋地址、房屋详情(户型)以及经纪人、房屋价格`五个属性。 4. 在获取了数据之后我们运行`matplotlib.py`文件。进行数据清洗,分析可视化。运行后即可获得**功能**中展示四个图片。 **技术栈** 1. request 2. parsel 3. pandas 4. matplotlib **进步(相比之前)** 此次爬虫相比之前的技术上可以说有减无增。但其中注释相当详细,可谓是每行代码都有注释。所以对于初学者应该有一些用处。同时使用matplotlib进行了数据分析可视化等。对于数据处理的代码的注释也是几乎每行都有注释的。
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值