北上广深租房图鉴(上)| 小笨聪用python爬取链家租房数据

本文通过Python爬虫获取链家网站的北上广深108532条租房数据,存入MongoDB数据库,并进行数据可视化分析。分析内容包括各城市房源分布、租金分布、租金与面积、地铁距离影响、装修类型对租金影响等,揭示了四大城市的租房市场特征。
摘要由CSDN通过智能技术生成

微信公众号原文链接

电视剧《恋爱地图上海篇》有一句台词:

上海很繁华,但没有一点真实的感觉。来这里工作两年了,没有一个朋友,没有一个爱人,我感觉我像是一个局外人一样,永远走不进去,也许,回老家更适合我吧。

这句话大致说出了不少在一线城市打拼的年轻人的心声。是啊,无论是北漂还是南漂,都有个绕不开的话题——租房。

 

为了详细了解北上广深的租房房源情况,小笨聪爬取了链家网上以上4个城市的所有租房数据,共计108532条(截止时间:2019年3月24日),存于 MongDB 数据库,并利用 jupyter、python 相关库和高德开放平台 进行数据可视化,得到完整的北上广深租房图鉴。推送分为两期,上期为可视化结果,下期为代码介绍。

本期是 北上广深租房图鉴(上)。下面让我们愉快地开始吧。

1.各城市房源分布

房源分布图中,将房源以小点形式显示在地图上,不同颜色的点基本代表不同的区域。

北京的租房数据有19898条。我们可以看到北京市中心的房源基本分布在二环以外四环以内,而周边各区的房源大多分布在区中心。其中,朝阳房源一枝独秀,占据北京房源近1/3,还是朝阳群众666啊!丰台、海淀房源分别占据第二和第三。

上海的租房数据有26657条。上海的房源也是多集中在中心城区和浦东,并且沿地铁分布密切,而其他区域房源多分布在区中心。其中浦东房源占1/4,侧面反映出浦东的发展欣欣向荣。

广州的租房数据有39958条。广州的房源数据是四个城市中最多的,除了和广东是人口大省有关外,还能反映出广州的人口流动性较大 。天河、白云、番禺的房源均在7000以上,给租客的选择也较多。小笨聪特意查看了一下广州的地铁线,发现3号线完美经过那个弧状房源密集带,可以想象其客流量之大。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值