python 获取boss直聘 php岗位防止urllib2 403错误

最新推荐文章于 2021-10-11 07:24:40 发布

lovenoodles

最新推荐文章于 2021-10-11 07:24:40 发布

阅读量768

点赞数

分类专栏：数据处理

本文链接：https://blog.csdn.net/eaglejiawo1120/article/details/84037888

版权

数据处理专栏收录该内容

5 篇文章 0 订阅

订阅专栏

直接上代码。初步获取url内容。添加header防止返回403错误。

import urllib2

url = "https://www.zhipin.com/job_detail/?query=php&scity=101010100&industry=&position="
headers = {'User-Agent': 'Mozilla/5.0 (Windows NT 6.1; WOW64; rv:23.0) Gecko/20100101 Firefox/23.0'}
req = urllib2.Request(url=url,headers=headers)
html = urllib2.urlopen(req).read()
# req = urllib.request.Request(url="http://en.wikipedia.org"+pageUrl)
print html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lovenoodles

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python 获取boss直聘 php岗位防止urllib2 403错误

直接上代码。初步获取url内容。添加header防止返回403错误。 import urllib2url = "https://www.zhipin.com/job_detail/?query=php&amp;scity=101010100&amp;industry=&amp;position="headers = {'User-Agent': 'Mozilla/5.0 (Window...
复制链接

扫一扫