requests是python实现的简单易用的HTTP库,使用起来比urllib简洁很多
因为是第三方库,所以使用前需要cmd安装
pip install requests
安装完成后import一下,正常则说明可以开始使用了。
基本用法:
requests.get()用于请求目标网站,类型是一个HTTPresponse类型
import requests
response = requests.get('http://www.baidu.com')
print(response.status_code) # 打印状态码
print(response.url) # 打印请求url
print(response.headers) # 打印头信息
print(response.cookies) # 打印cookie信息
print(response.text) #以文本形式打印网页源码
print(response.content) #以字节流形式打印
运行结果:
address.status_code ==requests.codes.ok
True 返回True,也代表链接成功。
状态码:
200 请求成功
301 资源被转移
404 请求资源不存在
500 服务器内部错误
##获取出来编码不对怎么办?
我们可以 通过address.encoding = “utf-8” # 设置编码格式
注意 设置的编码格式要和原来的网站编码格式一致。