python爬虫重定向问题_python爬虫（网页重定向怎么破？）

最新推荐文章于 2024-04-30 17:47:26 发布

WngWai

最新推荐文章于 2024-04-30 17:47:26 发布

阅读量2k

点赞数

文章标签： python爬虫重定向问题

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_30294759/article/details/112515346

版权

*****声明：此实例仅用于学习 *****

1.网页重定向。

在分析房天下网站，不难发现每个网页有个重定向，比如：访问网页https://cd.esf.fang.com/chushou/3_211293494.htm会跳转至https://cd.esf.fang.com/chushou/3_211293494.htm?rfss=1-b71f212cbb874a451c-3a 这个网页，其实两个地址打开的是同一个网页

解决方法：在原网页源代码中找到重定向网址，request 新网址即可。

response=requests.get(url,headers = headers)

html=response.text

#网页重定向

pat=re.compile(r'点击跳转')

url=re.findall(pat,html)[0]

response=requests.get(url,headers = headers)

return response.text

2.bs4获取标签内容，部分代码

BeautifulSoup4是爬虫必学的技能。BeautifulSoup最主要的功能是从网页抓取数据，Beautiful Soup自动将输入文档转换为Unicode编码，输出文档转换为utf-8编码。BeautifulSoup支持Python标准库中的HTML解析器,还支持一些第三方的解析器，如果我们不安装它，则 Python 会使用 Python默认的解析器，lxml 解析器更加强大，速度更快，推荐使用lxml 解析器。网上相关文章和介绍很多，不在此啰嗦。

temp_dict['房源']=soup.find('title').string

temp_dict['小区'] = soup.find('div',id="xq_message").get_text()

temp_dict['总价']=soup.find('div',class_="tab-cont-right").find('div',class_="trl-item price_esf sty1").get_text()

3.将数据保存在csv文件中。

我们将获取房源信息的

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
python爬虫重定向问题_python爬虫（网页重定向怎么破？）

*****声明：此实例仅用于学习 *****1.网页重定向。在分析房天下网站，不难发现每个网页有个重定向，比如：访问网页https://cd.esf.fang.com/chushou/3_211293494.htm会跳转至https://cd.esf.fang.com/chushou/3_211293494.htm?rfss=1-b71f212cbb874a451c-3a 这个网页，其实两个地址...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。