如何在上海租房,数据有话说

                                                                 “住得舒心才能安心学习”

租房,一个上漂族绕不过的问题。

租房者往往会去到58、豆瓣等租房信息发布平台查询数据,但简单的网页浏览却很难解决租房者不能全面认知上海租房市场的情况。这时候,如果会一点爬虫和数据分析技能,就会事半功倍——比如使用租房平台上的房源数据,搭建一款适合自己的租房查询系统:

首先,我们获取了一份上海租赁房源数据:

时间节点:2019.7.17

时间节点:2019.7.17

然后,通过Echarts,我将爬到的数据做成了一个简单的查询系统:

 

点击两个页面按钮,可以分别查看【上海房租地图】和【统计分析结果】,在【上海房租地图】页,可以在地图上选中自己感兴趣的区域,了解该区县的市场分析详情。

 

在【统计分析结果】页,可以在搜索栏键入自己感兴趣的区域,一一查看该区域的租赁方式分布和房源朝向分布。

 

两个查询页面会在文末分享给大家,接下来让我们跟着数据一起阅读魔都的租房盛况。

 

1、哪里的房源最多

想要找房子,就从房源最多的地方看起。我们先来看看,哪个区的房子最多——

 

根据这份房源数据,上海平均每个区的房源有13875.44套,其中浦东新区最多,数量高达55472套,几乎是平均数的四倍!第二名是闵行区,房源数量为31851套,也是平均数的两倍多。意味着浦东、闵行两个区,拥有全上海最多的租房房源,是魔都租房市场最繁盛的区域。

当然各区面积大小不同,影响了房源数量排名。如果考虑区域面积,则又是一番景象:

 

黄浦区坐拥全上海最高租房房源集中度,平均每平方公里有878套在租房源!其次是静安、长宁、徐汇、虹口……都是上海的老城区,人多、房多、需求多。而总量排名第一的浦东区,在这一波操作后只能排到中游位置。

 

2、在上海租房子,要多少钱

租不租房子,房租是最重要的影响因素之一,考虑到租金和面积高度相关,为了更科学地比较区域因素,我们用租金除以面积,得到每个区房源的每平米平均房租:

 

房源密度最大的黄浦区,每平米平均房租依然领跑其他区域,高达137.22元。还有长宁,静安,虹口,徐汇四个区的平均平米租金都超过了100元,意味着在这些地方,租一间30平米的房子,平均都超过3000元,这些区域也正是工作机会多、人流相当密集的区域;而奉贤,金山,平均平米租金在30元出头,住在这些地区的朋友们房租压力就小了许多。到底是花更多的钱住在热闹的地方以便日常通勤和玩耍,还是省点钱住在相对郊远的地区,大家可以根据自己的需要见仁见智。

我突然好奇,上海在租的最贵房源有多贵呢?不看不知道,一看吓一跳,我们发现当前在租房源中,最贵月租金居然超过40W!究竟是什么样的房子值得这样的租金呢?打开详情页面看一下——

 

繁华地段,紧邻地铁,全装全配,整栋洋房,含地下室和园林,10部车位——处处透露着高贵的气息!我们注意到页面有一个词:商业用房。果然,这么贵的房子一定不是用来给普通人居住的。嗯,够气派!

 

3、什么租赁方式的房源最多

了解过租房的小伙伴一定对整租和合租的概念不陌生。那么究竟哪种租赁方式的房源更多呢?

 

整租房源在数量上占有绝对的优势,全市范围内的比例占到了惊人的97%!这可能和我们日常的认知并不十分相符:独自在外打拼的年轻人,一个人租住一整套房子的,似乎并没有那么多。

但整租房源为何占比如此之高呢?我认为原因在于,整租是明显对房东有利的租赁方式。房东只需要签完整租合同,就可以坐等租金定期到账,自然是最轻松的,每间房都要重新找租客岂不费心费力?(画外音:原来钱多事少离家近的工作也是有烦恼的!)

在外打拼不易,搬家也麻烦,在租房市场上,租客大部分时候还是相对弱势的。而且对于租客而言,和亲朋好友结伴租房,一般也要比和随机掉落的合租室友相处得称心。所以,想要租房子的小伙伴,我们建议要么自己整租一套,要么自己找好室友再一起整租,这样更容易租到房子

 

4、什么样的户型最多

同样,还是先看结论:

 

图中可以看到,一、二、三室的户型占有绝对的优势,其中两室户是最多的,数量几乎相当于一室户和三室户的总和。二室适合情侣、朋友整租,也适合网友、陌生人合租,性价比高,因此需求也大。但在上海,“二室”的面积和租金范围其实很广,取决于房东/中介是如何定义二室:

 

在去除二室租金和面积异常值后,利用散点图我们可以观察到“二室”主要有种

1、25平米左右,租金在2500左右的“低配二室户”,适合手头有点紧却需要租二室户的朋友,或接受租赁合租二室户中的单间房间的朋友:

 

2、50-100平米,租金在3000到7500左右的“奢华二室户” ,适合有壕朋友合租租客一起享受奢华阳光大厅房。

 

注意到还有57个9室户,随机找一个来看看图:

 

沿街独栋花园~租金嘛,一个月35W……嗯我就看看

 

5、哪条地铁线附近的房源出行最方便

交通因素是对居住体验有明显影响的。我们根据房源的描述,计算出不同地铁沿线房源,离地铁站的平均距离,得到下图:

 

画在地图上大概长这样(由于基础数据未更新,地图中没有17号线):

 

图中我们可以看到,四号线沿线的房源,离地铁站往往比较近,平均距离仅446米;而16号线通向滴水湖地区,最为偏远,沿线的房源,和地铁站的平均距离有742米。多了将近300米的步行距离,沿线居住社区的尺度大小是不一样的。

根据上面的分析,大家应该已经有了一个认知:城市中心地区的行政区房源集中度高于非中心地区。四号线正是内环分界线,沿线基本都在上海的中心地带,其他线路多少都起到连接非中心地区和中心地区的作用,所以在在平均距离上表现最好的是四号线。

 

6、哪个区的房源质量最整齐

租房子的时候既要考虑价格,又要考虑面积,还要考虑离地铁站的距离等等,可真难选。那么不妨做做分析,看看哪个区的房源,质量最整齐,最适合盲选。

考虑租赁面积、租赁价格和区位因素(房源离地铁站的距离)三个指标,每个区的房源数据,我们对这三个指标求标准差再做归一化进行评分,得分越高,表示房源质量越接近。得到了如下雷达图:

 

黄浦区的房源,三个指标评分都很高,标准差很小,说明该区的房源,价格、面积、交通条件彼此都比较接近,而我们知道,黄浦区的平米平均租金和房源集中度都领先于上海其他各区。如果懒得到处比较,想在租到好的房子,又有足够的预算,黄浦区将是你的最佳选择。

 

奉贤、金山、松江等区的房源,面积、区位、租赁价格标准差都比较大,其中价格标准差多于其他两项。因此在这些区域租房子,就要多比较几家,综合考虑各个方面的条件,选出自己满意、性价比合适的房子。

 

7、总结建议

俗话说,房子是租来的,但生活不是。称心的住处总会让人更安心地工作、学习和玩耍。结合数据分析了这么多,可以给大家提供一些参考:

1)浦东新区和闵行区拥有整个上海最多的租房房源,黄浦区的房源密度最大。综合来看,城市中心区域的房源密度高于其他行政区;

2)黄浦,长宁,静安,虹口,徐汇五个人多房多的老城区,平均平米租金都超过了100元,想在这些地方租房子要准备充足的预算;

3)上海房源以整租二居室居多,觉得单独承担整租租金太贵的小伙伴,可以先找室友再一起合租;

4)黄浦区的房源,价格、面积和交通条件彼此差异最小,房源质量相对最为整齐,盲选最不容易出错,而单位面积租金也最高,适合有预算、有选择恐惧症的朋友;

5)弄清楚自己的需求,再进行有针对性的查找和比较,最容易租到称心的房子。


关注公众号“大鹏教你玩数据”,后台回复【48】,可以获取本文开头所述Echarts展示页面

### 安居客出租房(武汉为例)爬虫+数据分析+可视化 这个爬虫是我前段时间在淘宝上做单子的时候遇见的一个客户需求。本来以为就是一个简单的爬虫项目。但后面客户加了数据清洗和数据分析的要求。而后又加了要详细代码解释的需求等等。直到最后客户坦白这是他们大专的毕设.......但是这个单子坐下来只有200左右,我想了一下,感觉好亏啊。在淘宝上随便找一个做毕设的都要好多钱的,而且客户本身的代码能力、数学、逻辑能力都很差,导致我每行都给注释以及看不懂,在我交付代码后又纠缠了我一个多礼拜。反正总体做下来的感觉就是烦躁。头一次感觉到了客户需求变更带来的巨大麻烦。 总之这是一次不是很愉快的爬虫经历。但是作为我写爬虫以来注释最详细的一次,以及第一次真正使用像matplotlib这种数据分析库的代码,我认为还是有必要分享出来给大家当个参考的(PS:大佬轻拍~)。爬虫本身几乎没有什么难度,写的也比较乱,敬请见谅。 **功能** 爬取安居客上的出租房信息(武汉地区的),并通过爬取的数据进行数据清洗以及数据分析。给出四个不同层面的可视化图。最终结果如下图所示: ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/1.png) ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/2.png) ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/3.png) ![Image text](https://raw.githubusercontent.com/srx-2000/git_spider/master/anjuke_room_rent_info/result/4.png) **环境** 1. Windows 10 2. python3.7 **使用方法** 首先声明该爬虫由于是特定情况下写的,所以本身的通用性特别差,仅可以对安居客网站上的武汉的出租房信息进行爬取,且需要自己手动更新cookie。同时在对数据进行分析及可视化的时候由于也是特别针对武汉出租房的进行的,所以针对性也比较强。如果别的需求需要自己进行更改。 1. 访问[安居客网址](https://wuhan.anjuke.com/),获取cookie。 > tip:获取cookie的方法可根据[此链接](https://jingyan.baidu.com/article/5d368d1ea6c6e33f60c057ef.html) 2. 在项目中找到`spider.py`的文件,将第12行的cookie换成你自己的cookie。 3. 运行`spider.py`,获取房源信息。运行后应会产生一个`武汉出租房源情况.csv`的文件。此文件为我们从安居客上爬取的房源信息,其中包含`房屋租住链接、房屋描述、房屋地址、房屋详情(户型)以及经纪人、房屋价格`五个属性。 4. 在获取了数据之后我们运行`matplotlib.py`文件。进行数据清洗,分析,可视化。运行后即可获得**功能**中展示四个图片。 **技术栈** 1. request 2. parsel 3. pandas 4. matplotlib **进步(相比之前)** 此次爬虫相比之前的技术上可以有减无增。但其中注释相当详细,可谓是每行代码都有注释。所以对于初学者应该有一些用处。同时使用matplotlib进行了数据分析可视化等。对于数据处理的代码的注释也是几乎每行都有注释的。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值