python—武汉市2021年新房数据分析

        最近看了国家统计局发布的(2021年8月份70个大中城市商品住宅销售价格变动情况),看到武汉新房各类面积对应上月的环比价格又提升了,于是使用python盘了某家平台上的新房数据。将武汉13个区的新房的均价、面积、数量等用echarts制作了对应统计图,进行相关的数据分析。数据源比较单一,可以作为学习使用。

图片

准备

  • 测试数据

  • pyecharts(或者echarts)相关使用

01 快速开始

由于统计图制作比较简单,就不上所有示例代码了,如果不太了解echarts的后端开发人员,可以使用pyecharts工具包来制作统计图。后面的数据都是在mysql中执行查询语句执行的结果 + echarts直接渲染出来的。

安装相关工具包

pip install pyecharts
pip install pymysql

示例代码:

# 根据pyecharts官方文档导入相关模块
from pyecharts.charts import Pie
from pyecharts import options as opts

# 查询武汉所有区域新房的数量并根据数量从高到低排序
"""
sql = "SELECT area_name,count(area_name) as sum from demo group by area_name ORDER BY sum desc"
"""

data = [
    ['洪山', 180],
    ['汉阳', 180],
    ['东西湖',180],
    ['黄陂', 180],
    ['江岸', 160],
    ['蔡甸', 140],
    ['江夏', 125],
    ['新洲', 110],
    ['江汉', 100],
    ['硚口', 90],
    ['武昌', 80],
    ['青山', 50],
    ['汉南', 40],
]

colors = ["#f47920", '#4e72b8', '#9b95c9', '#dea32c', '#65c294', '#f36c21',
          '#6c4c49', '#f2eada', '#008792', '#b64533','#63434f', '#ea66a6', '#f69c9f']


c = (
    Pie()
    .add("", data)
    .set_colors(colors)
    .set_series_opts(label_opts=opts.LabelOpts(formatter="{b}: {c}"))
    .render("pie_set_color.html")
)

在浏览器打开当前目录下的pie_set_color.html文件。

武汉市各个区域新房的饼状图

图片

图片

可以看出东西湖、汉阳、洪山、黄陂新房出售比较多、其次是江岸和蔡甸。

柱状图—最受欢迎面积

图片

90㎡-100㎡更受大家欢迎,105㎡其次。

地图展示—各区域新房小区均价

如果需要自定义区域的话,可以在该链接中找到相关json数据,复制json地址替换到相应的代码即可切换。

图片

武昌区的房屋总的平均价最贵,相对汉南区和新洲区相较便宜些。

柱状图—区域新房排序(平均单价)

图片

武昌区的新房小区平均价格高达28580元/㎡,不知道你们怎么看?

柱状图—区域新房排序(平均总价)

图片

折线图—各地方新房数量top10

图片

查询数据库中的地方新房top10数据,在13个区域中,阳逻的新房出售数量最多,多达92个。

测试数据

图片

参考文档

# pyecharts官方文档
https://pyecharts.org/#/zh-cn/intro

当数据分析遇上数据可视化时使用pyecharts 是非常方便的。大伙如果需要数据的话,可以在公众号中输入"房价数据"来获取房价测试数据提取码。

https://pan.baidu.com/s/19FSiWr7YlPdn3cPhc0GLJw 

感兴趣的可以关注作者微信公众号:程序员9527

图片

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 安居客出租房(武汉为例)爬虫+数据分析+可视化 这个爬虫是我前段时间在淘宝上做单子的时候遇见的一个客户需求。本来以为就是一个简单的爬虫项目。但后面客户加了数据清洗和数据分析的要求。而后又加了要详细代码解释的需求等等。直到最后客户坦白说这是他们大专的毕设.......但是这个单子坐下来只有200左右,我想了一下,感觉好亏啊。在淘宝上随便找一个做毕设的都要好多钱的,而且客户本身的代码能力、数学、逻辑能力都很差,导致我每行都给注释以及看不懂,在我交付代码后又纠缠了我一个多礼拜。反正总体做下来的感觉就是烦躁。头一次感觉到了客户需求变更带来的巨大麻烦。 总之这是一次不是很愉快的爬虫经历。但是作为我写爬虫以来注释最详细的一次,以及第一次真正使用像matplotlib这种数据分析库的代码,我认为还是有必要分享出来给大家当个参考的(PS:大佬轻拍~)。爬虫本身几乎没有什么难度,写的也比较乱,敬请见谅。 **功能** 爬取安居客上的出租房信息(武汉地区的),并通过爬取的数据进行数据清洗以及数据分析。给出四个不同层面的可视化图。最终结果如下图所示: ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/1.png) ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/2.png) ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/3.png) ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/4.png) **环境** 1. Windows 10 2. python3.7 **使用方法** 首先声明该爬虫由于是特定情况下写的,所以本身的通用性特别差,仅可以对安居客网站上的武汉的出租房信息进行爬取,且需要自己手动更新cookie。同时在对数据进行分析及可视化的时候由于也是特别针对武汉出租房的进行的,所以针对性也比较强。如果别的需求需要自己进行更改。 1. 访问[安居客网址](https://wuhan.anjuke.com/),获取cookie。 > tip:获取cookie的方法可根据[此链接](https://jingyan.baidu.com/article/5d368d1ea6c6e33f60c057ef.html) 2. 在项目中找到`spider.py`的文件,将第12行的cookie换成你自己的cookie。 3. 运行`spider.py`,获取房源信息。运行后应会产生一个`武汉出租房源情况.csv`的文件。此文件为我们从安居客上爬取的房源信息,其中包含`房屋租住链接、房屋描述、房屋地址、房屋详情(户型)以及经纪人、房屋价格`五个属性。 4. 在获取了数据之后我们运行`matplotlib.py`文件。进行数据清洗,分析,可视化。运行后即可获得**功能**中展示四个图片。 **技术栈** 1. request 2. parsel 3. pandas 4. matplotlib **进步(相比之前)** 此次爬虫相比之前的技术上可以说有减无增。但其中注释相当详细,可谓是每行代码都有注释。所以对于初学者应该有一些用处。同时使用matplotlib进行了数据分析可视化等。对于数据处理的代码的注释也是几乎每行都有注释的。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值