如何避开403forbiddern使用爬虫request

最新推荐文章于 2024-02-29 07:00:00 发布

cmdch2017

最新推荐文章于 2024-02-29 07:00:00 发布

阅读量410

点赞数

分类专栏： Java 文章标签： Python urllib 请求响应头 User-Agent

本文链接：https://blog.csdn.net/weixin_43914278/article/details/109258787

版权

Java 专栏收录该内容

100 篇文章 0 订阅

订阅专栏

from urllib import request

url = "https://i.snssdk.com/feoffline/hot_list/template/hot_list/forum_tab.html?activeWidget=1"
header = {
    "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111 Safari/537.36"
}
req = request.Request(url, headers=header)
res = request.urlopen(url)
print(res.info()) #响应头
print(res.getcode()) #状态码
print(res.geturl()) #网址

# html = res.read()
# html = html.decode("utf-8")
# print(html)

核心方法就是添加一个header可以正常爬取信息。至于这里url指的是要访问的网站。

这里的header是你要替换的地方，具体步骤F12，然后查找User-Agent，按照上面的格式替换掉我写的代码即可，可以看到右下角就有User-Agent=XXX

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

cmdch2017

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何避开403forbiddern使用爬虫request

from urllib import requesturl = "https://i.snssdk.com/feoffline/hot_list/template/hot_list/forum_tab.html?activeWidget=1"header = { "User-Agent": "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.111.
复制链接

扫一扫