python找房源_如何用Python找到房源信息(2)

最新推荐文章于 2023-01-07 19:07:52 发布

科技娜评

最新推荐文章于 2023-01-07 19:07:52 发布

阅读量421

点赞数

文章标签： python找房源

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_35851654/article/details/114431014

版权

本文介绍如何使用Python分析房源数据，选择离工作地最近的区域，并对区域内房源进行深入分析，包括价格、面积、楼层和房屋类型等，帮助做出更经济的租房决策。

摘要由CSDN通过智能技术生成

主要是距离，关于距离，有两种选择方式，一种是先选出离你上班地最近的几个区域，然后再在该区域内具体选择；另一个是可以设定你可以接受的通勤距离，然后以这个距离作为条件，在小于等于这个距离内进行筛选。

我们这里着重以第一种为主，先选择距离最近的几个区域，然后在这几个区域内进行选择。

因为距离是按 Region 来进行计算的，而表是按 Name 来统计的，所以要想计算出距离最近的 Region，需要先把 Region 和 Distance 部分提取出来，并合并成一个 DataFrame。

可以看到，Region=“望京”距离最近，所以我们重点在该区域内选择，接下来具体看看该区域内租房情况。

通过上表可以看到在望京区域总共有 101 套房源，接下来对这 101 套房源进行深入分析。

数据概览，先对该区域的租房整体情况有个认识，看到 Price 指标的下界为 5000 左右，上界接近于 30000，中位数为 10000 出头(有没有感觉到好贵哈哈哈哈)，但是我们也看到有一个大于 80000 的超级异常值，我们利用截尾均值对他进行替代。

关于房屋大小，中位数为 100 平，这与 Price 中位数正好可以对应，折算下来相当于 1 平 100 大洋，在与那些 10 平左右的合租房需要 2000+ 大洋比一比，是不是觉得还是 100 平 10000 大洋便宜哈。

所以论一平米的价格的话还是整租更便宜。

先找出那个大于 80000 的异常值具体值是多少，然后进行值替换。

这是将 Price 异常值处理以后得到的箱型图，看起来就比较规范了哈。

通过上图可以看出：中楼层和高楼层的房源绝对数量基本持平，高出低楼层数量一半。

房屋修建时间也是 2003 年以后的居多，这就和前面的楼层类型可以对应上了，在刚开始的时候(2003 年以前)大部分房子都是低楼层，随着时代的进步，科技的发展，人员的增多，楼层的数量和房屋的数量也随之增加。

房屋类型上的 Top3 类型分别为：2 室 1 厅、3 室 2 厅和 1 室 1 厅。

通过上图可以看出，随着时间的推移，2003 年以后的房子的 Price 要明显高于 2003 年以前的，如果要是对价格比较敏感，可以考虑 2003 年以前的房子。

随着房屋类型的升级，价格也是随之升高，但是我们也发现，有一些三室房子的价格(下边界)要低于两室的价格的，如果对房间数量和价格都有要求的可以考虑这部分房源。

通过上图可以看到三个楼层的价格下界基本持平，但是中楼层的中位数和上界价格是要明显高于其他两个房型的，这也很正常，中楼层相比于其他两个楼层的房屋是最宜居的啦，价格贵也正常。

当然了，对于现在租房都很困难的环境下，哪还考虑什么宜居，当然是挑价格低的房型。

按 PV 进行降序，我们可以看出哪些房源是比较受欢迎，这些房源都有啥特征。

从图中可以看到，低楼层的房源数量不是最多的，但是看房次数却是最多的(最受欢迎的)，可能是低楼层价格低的原因吧。

2003 年和 2007 的房源 PV 最高，这和该年代的房源绝对数量基本维持一致；两室一厅的户型最为火爆；在价格方面 10000 以下的房源比较受欢迎。

结论

通过上面的分析我们可以得出一些参考：

2003 年以前的房源的价格是要低于 2003 年之后的，对价格敏感的可以考虑 2003 年以前的房源。

有一些三室的房子价格是低于两室的，如果对房间数量和价格都有要求的可以考虑这部分。

中楼层的价格整体上是要高于低楼层的，但是还有一部分是要比低楼层低，而且通过从 PV 最高的楼层来看，低楼层的火爆程度要比中楼层高，所以可以寻找那些不那么火爆但是价格还低的中楼层。

如果希望单位面积价格最低，还是整租比较合适。

注：本次的数据为链家网的整租房源信息，非合租信息，所以你会看到价格都很高。

作者：张俊红

原文来自微信公众号：51CTO技术栈

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。