一个特定的库函数往往包含很多内容,看函数原型和大佬的代码对新手(比如我)都不太友好,入门的时候我们不需要对一个库的所有内容都了如指掌,理解一些基础的、可能会用到的函数会更容易上手(当然这篇博客也是我的备忘录)。
**
requests 常用于请求url并获取响应
**
先看一段简单的代码
response = requests.get(url = 'https://www.baidu.com')
调用requests库,使用get的方法,获取一个url的响应。
**什么是响应?**可以类比打开文件的方法:
with open('小说.txt',mode = 'r',encoding = 'utf-8') as fp:
text = fp.read()
用只读的方式打开文本“小说.txt”,并用变量名fp接收,但fp不是文本里的内容,而是一个句柄,如果要调用文件里的内容,就需要对句柄使用read(),所以这里的句柄可以理解为一个身份标识符,告诉我们fp指向的是这个文本,而不是那个文本。
响应也是,一个网页包含的不仅仅是我们看到的内容(通常经过渲染),为了获取网页中各种类别的信息,我们就需要得到一个响应,并对这个响应进行后续操作(如同对fp进行read一样):
打印响应response
<Response [200]>
返回2开头的响应代表访问成功,3开头代表跳转,4开头代表页面不存在,5开头表示服务器存在问题
获取html
html = response.text
结果
<!DOCTYPE html>
<!--STATUS OK--><html> <head><meta http-equiv=content-type content=text/html;charset=utf-8><meta http-equiv=X-UA-Compatible content=IE=Edge><meta content=always name=referrer><link rel=stylesheet type=text/css href=https:/