使用Requests简单爬取页面

最新推荐文章于 2024-05-31 09:00:00 发布

小歘欻

最新推荐文章于 2024-05-31 09:00:00 发布

阅读量672

点赞数

分类专栏： Python爬虫文章标签： python 爬虫

本文链接：https://blog.csdn.net/qq_33840688/article/details/119084300

版权

Python爬虫专栏收录该内容

3 篇文章 0 订阅

订阅专栏

import requests

url = 'https://wh.58.com/sou/?key=python%E5%B7%A5%E7%A8%8B%E5%B8%88'

headers = {
    'user-agent': 'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/86.0.4240.75 Safari/537.36'
    , 'referer': 'https://wh.58.com/sou/?key=python'
}

res = requests.get(url, headers=headers)
with open('6.html', 'w') as f:
    f.write(res.content.decode('utf-8'))
    f.close()

requests是一个简单的http库，基于urlib编写，相比urlib更加简单易用

使用requests.get请求获取网页，headers请求头进行伪装

鼠标点击右键--检查--NetWork点击一个请求可以查看这个请求的请求头等各项参数