为什么我用python爬取拉勾网的数据，设置了User-Agent和Referer参数，却还是被反爬虫了

qq_40244636

于 2019-07-13 08:47:41 发布

阅读量758

点赞数

文章标签： python爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40244636/article/details/95721801

版权

代码如下,是跟着视频教程写的一样的：
from urllib import request
from urllib import parse
url = ‘https://www.lagou.com/jobs/positionAjax.json?city=成都&needAddtionalResult=false’

headers = {
‘Referer’: ‘https://www.lagou.com/jobs/list_pythonc?ity=成都&cl=false&fromSearch=true&labelWords=&suginput=’,
‘User-Agent’: ‘Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/75.0.3770.100 Safari/537.36’
}

data = {
‘first’:‘true’,
‘pn’:1,
‘kd’:‘python’
}

req = request.Request(url, headers=headers, data=parse.urlencode(data).encode(‘utf-8’), method=‘POST’)
resp = request.urlopen(req)
print(resp.read().decode(‘utf-8’))

运行的时候提示我：{“status”:false,“msg”:“您操作太频繁,请稍后再访问”,“clientIp”:“180.85.42.80”,“state”:2402}

显然，我被反爬虫了，请问有大佬知道为什么嘛

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
8
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qq_40244636 CSDN认证博客专家 CSDN认证企业博客

码龄7年

1: 原创

175万+: 周排名

47万+: 总排名

757: 访问

: 等级

24: 积分

1: 粉丝

0: 获赞

8: 评论

0: 收藏

私信

关注

热门文章

为什么我用python爬取拉勾网的数据，设置了User-Agent和Referer参数，却还是被反爬虫了 758

最新评论

为什么我用python爬取拉勾网的数据，设置了User-Agent和Referer参数，却还是被反爬虫了
难的想了: [code=csharp] 还要在header里构造： 'X-Anit-Forge-Code': 0, 'X-Anit-Forge-Token':'None', 'X-Requested-With':'XMLHttpRequest', 'origin_req_host':'www.lagou.com', 'Cookie'：“你所获取的cookie” [/code]
为什么我用python爬取拉勾网的数据，设置了User-Agent和Referer参数，却还是被反爬虫了
难的想了: 还要在header里构造： 'X-Anit-Forge-Code': 0, 'X-Anit-Forge-Token':'None', 'X-Requested-With':'XMLHttpRequest', 'origin_req_host':'www.lagou.com', 'Cookie'：“你所获取的cookie”
为什么我用python爬取拉勾网的数据，设置了User-Agent和Referer参数，却还是被反爬虫了
难的想了: 不能回复？
为什么我用python爬取拉勾网的数据，设置了User-Agent和Referer参数，却还是被反爬虫了
难的想了: 还要在header里构造： 'X-Anit-Forge-Code'， 'X-Anit-Forge-Token'， 'X-Requested-With’，'origin_req_host':'www.lagou.com', 'Cookie'：“你所获取的cookie”
为什么我用python爬取拉勾网的数据，设置了User-Agent和Referer参数，却还是被反爬虫了
难的想了: 还要在header里构造： 'X-Anit-Forge-Code': 0, 'X-Anit-Forge-Token':'None', 'X-Requested-With':'XMLHttpRequest', 'origin_req_host':'www.lagou.com', 'Cookie'：“你所获取的cookie”[code=python] : 0, [/code][code=python] : 0, [/code]

最新文章

目录

评论 8

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。