爬虫之requests

最新推荐文章于 2024-05-21 09:51:42 发布

xiaobai110188

最新推荐文章于 2024-05-21 09:51:42 发布

阅读量1k

点赞数

本文链接：https://blog.csdn.net/xiaobai110188/article/details/107912722

版权

本文介绍了Python爬虫中的requests库，详细讲解了如何使用requests.get()方法向服务器发送请求并获取响应。通过实例展示了文本和图片的爬取过程，包括获取HTTP响应的状态码和响应内容。文章还提及了requests库在爬取三国演义文本和图片时的应用，揭示了爬虫的基本工作原理。

摘要由CSDN通过智能技术生成

引入requests库

import requests

requests.get是在调用requests库中的get()方法，它向服务器发送了一个请求，括号里的参数是你需要的数据所在的网址，然后服务器对请求作出了响应。

我们把这个响应返回的结果赋值给变量res

res = requests.get(‘URL’)

文本爬取

import requests
res = requests.get('https://localprod.pandateacher.com/python-manuscript/crawler-html/sanguo.md')
print(res.status_code)# 第3行代码是在打印res的响应状态码，它可以用来检查我们的requests请求是否得到了成功的响应。我们看到终端结果显示了200，这个数字代表服务器同意了请求，并返回了数据给我们
print(type(res))# 这代表着：res是一个对象，属于requests.models.Response类
# 把Response对象的内容以字符串的形式返回
novel = res.text
# 创建一个名为《三国演义》的txt文档，指针放在文件末尾，追加内容
k = open('《三国演义》.txt','a+')
# 写进文件中 
k.write(novel)
# 关闭文档    
k.close()

结果显示：
200
<class ‘requests.models.Response’>
在这里插入图片描述

三国演义

作者：罗贯中

第一回

最低0.47元/天解锁文章

xiaobai110188

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
爬虫之requests

引入requests库import requestsrequests.get是在调用requests库中的get()方法，它向服务器发送了一个请求，括号里的参数是你需要的数据所在的网址，然后服务器对请求作出了响应。我们把这个响应返回的结果赋值给变量resres = requests.get(‘URL’)文本爬取import requestsres = requests.get('https://localprod.pandateacher.com/python-manuscript/crawl
复制链接

扫一扫