python爬虫，requests发送get请求，视频笔记（2）

最新推荐文章于 2024-05-17 01:06:25 发布

废柴成长中——

最新推荐文章于 2024-05-17 01:06:25 发布

阅读量1.7k

点赞数

分类专栏：解读python 文章标签： python 爬虫音视频

本文链接：https://blog.csdn.net/heipao17/article/details/122481802

版权

解读python 专栏收录该内容

12 篇文章 0 订阅

订阅专栏

requests模块自行搜索办法下载。他是爬虫神器。

要爬取先要知道它的网址url

url='https://www.baidu.com'

然后发送请求，但是请求有很多种，我们得知道我们爬取的网页它吃哪一种。这个时候就用得上我上一篇博客里记载的浏览器工具了。

因为我们是向百度发送请求，所以在百度页面按F12
Network->All->Headers
在这里插入图片描述
可以看到百度吃的请求是GET类型的

import requests
# 爬百度的信息
url='https://www.baidu.com' 

#发送请求
resp=requests.get(url)
print(resp)

在这里插入图片描述
发送请求，得到一个回响resp,但是resp不是源代码，而是一个响应对象，这是因为响应对象包括了其它东西加上源代码，为了得到纯粹的源代码，还得进行下一步操作。即resp.text,print会发现有乱码

一旦发现有乱码，就去找print(resp.text)里的第一行charset,比如这个百度它的就是utf-8,因此，我们在拿源代码之前还得设置字符集。

import requests
# 爬百度的信息
url='https://www.baidu.com'
#发送请求
resp=requests.get(url)
#设置字符集
resp.encoding='utf-8'
print(resp.text)

在这里插入图片描述
接下来，我们把页面源代码写入文件

import requests
# 爬百度的信息
url='https://www.baidu.com'
#发送请求
resp=requests.get(url)
#设置字符集
resp.encoding='utf-8'
print(resp.text)
with open("mybaidu.html","w",encoding='utf-8') as f:#代码是html代码，所以存的时候也是html
    f.write(resp.text)

打开mybaidu.html运行一下，点击鼠标移动到代码就出现的图标，搜狗或其它浏览器都行。
在这里插入图片描述
运行成功

和原来的百度不一样，因为还只发送了一次请求.

废柴成长中——

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python爬虫，requests发送get请求，视频笔记（2）

requests模块自行搜索办法下载。他是爬虫神器。要爬取先要知道它的网址urlurl='https://www.baidu.com' 然后发送请求，但是请求有很多种，我们得知道我们爬取的网页它吃哪一种。这个时候就用得上我上一篇博客里记载的浏览器工具了。因为我们是向百度发送请求，所以在百度页面按F12Network->All->Headers可以看到百度吃的请求是GET类型的import requests# 爬百度的信息url='https://www.baidu.com'
复制链接

扫一扫