python 爬虫添加请求头headers

最新推荐文章于 2024-05-09 19:02:21 发布

戴上微笑

最新推荐文章于 2024-05-09 19:02:21 发布

阅读量2.8k

点赞数 1

分类专栏：爬虫文章标签： python 网络爬虫

本文链接：https://blog.csdn.net/dai1987csdn/article/details/110367163

版权

爬虫专栏收录该内容

14 篇文章 1 订阅

订阅专栏

有时候的请求网页内容时，会发现无论通过GET，POST以及其他请求方式，都会出现403错误。这种现象多数为服务器拒绝了您的访问，那是因为这些网站为了防止恶意采集信息，所使用的反爬虫设置。此时可以通过模拟浏览器的头部信息来进行访问，这样就能解决以上反爬设置的问题。代码如下：

import requests

url = 'https://www.baidu.com'#创建需要爬取网页的地址
#创建头部信息
headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.66 Safari/537.36'}
response = requests.get(url, headers=headers)#发送网络请求
print(response.status_code)#打印响应状态码 如果等于200说明请求成功

输出结果：
200

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

戴上微笑

关注关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
打赏
1
评论
python 爬虫添加请求头headers

有时候的请求网页内容时，会发现无论通过GET，POST以及其他请求方式，都会出现403错误。这种现象多数为服务器拒绝了您的访问，那是因为这些网站为了防止恶意采集信息，所使用的反爬虫设置。此时可以通过模拟浏览器的头部信息来进行访问，这样就能解决以上反爬设置的问题。代码如下：import requestsurl = 'https://www.baidu.com'#创建需要爬取网页的地址#创建头部信息headers = {'User-Agent':'Mozilla/5.0 (Windows NT 10.
复制链接

扫一扫