0 前言
如果我是房产投资人,我希望能用房子作为增值平台。我闲余资金不多,所以我想买不贵的房子用来投资。同时,我又想能利益最大化,那么这两个指标应该比较关键:
- 同一小区单价最低的房源;
- 不同小区,房屋挂牌单价与小区均价比值最小的房源;
那么,需求就来了,我们将一个城市每个小区现卖的房源单价按照从低到高的顺序排列起来。汇总之后,得出房屋挂牌单价与小区均价比值排序表。那这个岂不是一个很好的购房投资资料?
选取链家网作为抓取平台,以深圳链家为例:
其网站已具备每个大片区房屋单价排序功能,但是没有每个小区的单价排序。我所需求的功能是一个小区只给出一个单价最低的房屋信息,然后将这个单价排序。
1 分析
实现的思路也比较简单,分为以下几步:
- 抓取大片区的对应的url。如罗湖区,福田区等。作为一级入口;
- 将大片区以房屋单价排序,其展现内容就是以房屋单价从低到高的排序。一个小区不止一套房屋可能会出现在这个排序中。
- 抓取该列表下展现出的各套房屋的基本信息。包括大片区,小片区,小区名,房屋挂牌单价,小区均价,面积,总价,链接等。
- 当之后再遇到同一个小区时,将自动忽略该套房屋,因为它已不是该小区单价最低的房源了。
比如罗湖区共有984个小区,那么罗湖区的最后抓取的信息一定不会超过984条。因为很多小区不再有售卖信息了。
2 实现过程
2.1 程序结构
其中:
- Adsl.py是自动切换IP脚本;
- Agents是自动变换UA标志脚本;
- Lianjia.py是爬取深圳链家指定信息主程序;
- Lianjiaui.py是界面脚本;
- Main_start.py是主程序,用于界面和功能的总控程序;
- num.txt是为防止重复爬取,记载当前爬取第几页的第几条。
2.2 主界面
其中包含了爬虫的开始,停止,以及保存为Excel格式功能。并且具备按照单价、均价,两者比例以及总价格排序。
3 结果
完成爬取之后,我们就可以得到一份很有时效性的房产信息分析表了。
4 总结
以上提供了整体的抓取目的,抓取思路,具体代码实现起来也比较简单,就不放源码了,有什么问题互相交流。
源码放在百度云盘上了需要可以微信扫描下方CSDN官方认证二维码免费领取
![](https://img-blog.csdnimg.cn/img_convert/dc9ae02448beb31857e8acc4f8c18f76.png)
由于每个小区只选取了一个单价最低的代表,然后将所有代表进行综合分析,虽然说分析结果不能保证百分百可靠,但是作为房屋投资角度来讲,还是有相当不错的参考意义。
读者福利:知道你对Python感兴趣,便准备了这套python学习资料
👉[[CSDN大礼包:《python兼职资源&全套学习资料》免费分享]](安全链接,放心点击)
对于0基础小白入门:
如果你是零基础小白,想快速入门Python是可以考虑的。
一方面是学习时间相对较短,学习内容更全面更集中。
二方面是可以找到适合自己的学习方案
包括:Python激活码+安装包、Python web开发,Python爬虫,Python数据分析,人工智能、机器学习等习教程。带你从零基础系统性的学好Python!
零基础Python学习资源介绍
- ① Python所有方向的学习路线图,清楚各个方向要学什么东西
- ② 600多节Python课程视频,涵盖必备基础、爬虫和数据分析
- ③ 100多个Python实战案例,含50个超大型项目详解,学习不再是只会理论
- ④ 20款主流手游迫解 爬虫手游逆行迫解教程包
- ⑤ 爬虫与反爬虫攻防教程包,含15个大型网站迫解
- ⑥ 爬虫APP逆向实战教程包,含45项绝密技术详解
- ⑦ 超300本Python电子好书,从入门到高阶应有尽有
- ⑧ 华为出品独家Python漫画教程,手机也能学习
- ⑨ 历年互联网企业Python面试真题,复习时非常方便
👉Python学习路线汇总👈
Python所有方向的技术点做的整理,形成各个领域的知识点汇总,它的用处就在于,你可以按照上面的知识点去找对应的学习资源,保证自己学得较为全面。(全套教程文末领取哈)
👉Python必备开发工具👈
温馨提示:篇幅有限,已打包文件夹,获取方式在:文末
👉Python学习视频600合集👈
观看零基础学习视频,看视频学习是最快捷也是最有效果的方式,跟着视频中老师的思路,从基础到深入,还是很容易入门的。
👉实战案例👈
光学理论是没用的,要学会跟着一起敲,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉100道Python练习题👈
检查学习结果。
👉面试刷题👈
👉python副业兼职与全职路线👈
上述这份完整版的Python全套学习资料已经上传CSDN官方,朋友们如果需要可以微信扫描下方CSDN官方认证二维码 即可领取↓↓↓
![](https://img-blog.csdnimg.cn/img_convert/dc9ae02448beb31857e8acc4f8c18f76.png)