前言
使用Pyecharts对链家上的深圳二手房信息进行可视化分析,内容包括:
-
房屋面积与房屋总价散点图分布;
-
各行政区二手房均价;
-
均价最贵的10个地段;
-
户型分布;
-
标题中最常出现的词;
数据背景
-
数据来源:链家二手房上深圳的房源信息「后附爬虫代码」;
-
数量:共采集数据总量18841条,数据清洗后18811条;
-
数据字段:
项目内容
准备工作
-
导入项目所需第三方库以及数据:
房价整体分布
我们借助散点图来看目前深圳二手房价格的整体分布情况:
-
目前标价最高的一套房子位于深圳湾,面积600平米,价格9800W❗️❗️❗️
-
红色的点是房屋总价超过1000W的,当然可能这个散点图会存在一点误导,因为1000W以上的房源价格浮动比较大,导致红色部分视觉上占了大部分,实际上我们获取到的1.8W房源信息中,1000W以上的共1994条记录,占比11%,绝大部分的还是集中在500W左右。
-
所获取到的1.8W条房源信息中整体均价6.4W每平米。
各行政区均价
需要说明一点,我们采集的数据中未包含大鹏新区/光明新区,因为这两个新区房源信息较少,加上pyecharts里面深圳的行政区也未包含这两个新区,所以没将这两个区的数据统计在内:
-
本来pyecharts的交互优势到了文章页面却反而有点鸡肋了 ,具体均价如下:
-
目前最贵的还是南山区,整体均价8.1W每平米,最便宜的坪山区,均价3.6W每平米;
-
关内来说,最便宜的是盐田区,均价4.7W每平,不过房源较少;
-
关外最贵的是宝安区,均价6W,不过宝安区辖区面积大,价格跨度也比较广。
最贵的10个地段
看完了各行政区的均价,我们来看下更具体的,目前深圳房价最贵的10各地段都是什么位置:
-
深圳湾共计43套房源,整体均价15.2W每平米,甩开其他地段好几个身位;
-
唯一属于的关外地段宝安中心,排名第10,均价8.2W;
户型分布
户型里面有点凌乱,一些比较奇怪的户型(如8室0厅)就没算在里面,只取了数量前10的户型。
-
三室两厅是在出售的房源中占比最多,为25.9%,这也应该是目前最符合中国家庭的户型分布了;
-
在深圳如此高昂的房价压迫下,小户型也挺受欢迎,一室一厅,两室一厅也有不小的占比;
词频统计
获取到的标题是房屋中介或者业主在链家上发布房源时填写的标题信息,想要获得关注,一个抓人眼球的标题肯定不能少,透过标题我们也能发现目前买家都会关注哪些信息,我们来看看,标题中最常出现的都是什么词语:
-
生成词云
效果如下:
最后
太TM贵了!
附爬虫代码:
文末福利,史上最全Python资料汇总(长期更新)。隔壁小孩都馋哭了 — 点击领取