爬虫入门

最新推荐文章于 2022-04-09 23:43:45 发布

艾鹤

最新推荐文章于 2022-04-09 23:43:45 发布

阅读量146

点赞数

分类专栏： python 文章标签：爬虫

本文链接：https://blog.csdn.net/u010212101/article/details/111742847

版权

python 专栏收录该内容

63 篇文章 0 订阅

订阅专栏

1、一个简单的例子

1）获取网页内容

requests：get

url = ""
response = requests.get(url).content.decode('utf-8')

requests：get & 指定header内容

url = ""
# 指定浏览器代理，可以通过浏览器查看；也可以指定其他信息，
headers = {
    'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/87.0.4280.88 Safari/537.36'
}
cookie = {"Cookie": 'BAIDUID=FE0F97F1FC37C47792091A2523CD945F:FG=1; HMACCOUNT=CC6D0E280C842123'}
try:
    response = requests.get(url, headers=headers, cookie=cookie).content.decode('utf-8')
    json_dict = json.loads(response)
except:
    v_url = ''