Python爬取链家房价信息

最新推荐文章于 2024-08-13 21:38:27 发布

xunkhun

最新推荐文章于 2024-08-13 21:38:27 发布

阅读量1.5w

点赞数 7

分类专栏： python 爬虫文章标签： python 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/xunkhun/article/details/79349621

版权

本文介绍如何使用Python爬虫获取链家网上二手房信息，包括房源名称和价格。通过分析网页结构，利用requests和BeautifulSoup库抓取数据，并存储为CSV文件。需要注意CSV文件在Excel中可能显示乱码，需转换编码后再用Excel打开。

摘要由CSDN通过智能技术生成

房子问题近些年来越来越受到大家的关注，要了解近些年的房价，首先就要获取网上的房价信息，我们以链家网上出售的房价信息为例，将数据爬取下来并存储起来。

这次信息的爬取我们依然采取requests-Beautiful Soup的线路来爬取链家网上的出售房的信息。需要安装好anaconda，并保证系统中已经有requests库，Beautiful Soup4库和csv库已经安装。

网页分析

我们要爬取的网页如下，我们需要的信息有房子的名称和价格

https://sh.lianjia.com/ershoufang/

如下图：

下面我们来分析我们所要提取的信息的位置，打开开发者模式查找元素，我们找到房子的名称和价格；如下图：

我们可以看到我们所需要的房子名称的信息在{div class="title"}里面，价格信息在{div class="totalPrice"}里面，所有的信息都封装在li标签里面。

我们分析了一个网页里面的网页结构，要爬取其他网页的信息还要看到更多的结构；

第一个网页链接：https://sh.lianjia.com/ershouf

最低0.47元/天解锁文章

关注

7
点赞
踩
49

收藏

觉得还不错? 一键收藏
4
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 4

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。