最近一段时间经常刷到关于上海房价的文章
“上海房价疯涨!老破小学区房单价20万”
“上海房价疯狂上涨,有二手房1小时涨价40万元”
“上海房价上涨的极限在哪里”
类似的文章还有非常多
我就特别好奇,都说上海房价涨疯了,那到底涨了多少?是所有房子的价格都在疯涨吗?上海哪几个区的房子涨得最猛?
正好我之前分别在2017、2018和2019年用MATLAB爬过上海房价,试了一下发现爬虫脚本还能用,小修小补了一番就又爬了一遍
这次一共爬取了将近14000个上海小区的均价,数据来源于链家网,不过有不少小区因为没有房源出售,所以均价信息显示暂无
我把这次爬取的数据和2019年7月的数据做了一个简单的比较
上海所有区的房价全都上涨了,除了静安区,当然并不是说静安的房价跌了,而是静安区和闸北区合并之后,均价统计的数据源变了,原先的静安区和闸北区的房价肯定也是上涨的
所有区中每平方房价涨幅最猛的三个区分别是,浦东区(9331元),徐汇区(9221元),黄埔区(8054元)
按照涨幅百分比计算的话,涨价最猛的三个区分别是,浦东区(17.9%),青浦区(16.3%),闵行区(13.5%)
青浦区的涨幅还是挺出乎我意料的,我以为数据出现了错误,又检查了一遍,后来在网上找到了答案
然后我又把2018、2019和2021年3年各个小区均价的涨跌做了一个统计分析,结果还挺有意思的
横坐标是涨跌幅度,纵坐标是对应涨跌幅度的小区数占比,三年数据的结果都显示正态分布
2018年二手房价格较2017年平均跌2.5%,标准差为0.083,有31.0%的小区房价上涨
2019年二手房价格较2018年平均跌7.0%,标准差为0.091,有15.5%的小区房价上涨
2021年二手房价格较2019年平均涨7.5%,标准差为0.125,有76.9%的小区房价上涨
标准差的数据很有意思,标准差越大,表示各个小区涨跌数据离散程度越大,有价格疯涨的板块,也有滞涨甚至下跌的板块
2021年小区涨跌分布显得更加扁平,标准差要比过去几年的大不少,意味着各个板块的涨跌差异还挺大的,比如今年的浦东区和青浦区的涨幅就很惊人
除此之外,今年上海房价疯涨的因素之一是学区房,这也是标准差数据偏大的其中一个原因
而这次涨幅超过20%的小区数量超过8%,其中有145个小区均价涨幅超过30%,但是我认为这个数据是被低估的,因为有很多小区的均价显示“暂无”,房东并没有出售房源的意愿
以上就是今天关于MATLAB爬虫上海房价的一个简单分享,通过这次爬虫的数据也解答了我之前的疑问
文章的最后,我还想做一次小调研,作为打工人的我们,今年工资的涨幅跑赢上海房价7.5%的涨幅了吗?
还是学生的朋友,也可以在下方调研结果中了解一下,MATLABer们进入职场后的薪资涨幅现状
往期推荐
如何用MATLAB薅资本主义的羊毛
如果中国重新开发MATLAB大概需要多久?
吐槽一下MATLAB的workspace
曲线数据提取这块,MATLAB拿捏的死死的
考个驾照,逼得我把MATLAB都用上了…
一把王者荣耀的时间,让你学会MATLAB GUI
MATLAB处理数据,掌握这7个小技巧就够了!
作者介绍|打浦桥程序员
MATLAB GUI滞销工具开发人员
和你一起用MATLAB的角度看世界
![2700c00ad0092ce79b5845d60ab25987.png](https://img-blog.csdnimg.cn/img_convert/2700c00ad0092ce79b5845d60ab25987.png)