requests库
Response对象的四大属性
response.status_code
response.content
response.text
response.encoding
Robots协议
requests库
学爬虫离不开requests库来获取数据。
安装 pip install requests
requests库可以帮我们下载网页源代码、文本、图片,甚至是音频。其实,“下载”本质上是向服务器发送请求并得到响应。
requests.get() 向服务器发出请求。用法:
import requests #引入requests库
res = requests.get('URL') #requests.get是在调用requests库中的get()方法,它向服务器发送了一个请求,括号里的参数是你需要的数据所在的网址,然后服务器对请求作出了响应。
#我们把这个响应返回的结果赋值在变量res上。
res是一个Response对象,可以type(res)查看它的数据类型
Response对象的四大属性
response.status_code
用来检查我们的requests请求是否得到了成