目录
简介
requests库是一个第三方库,主要用于爬虫请求
作用和python自带urllib库类似,用于请求目标地址数据,更加方便
本文档内容以入门、实用、查漏补缺为主,避免过于全面造成冗长
从小实例入手:
import requests
headers = {'User-Agent': 'Mozilla/5.……'}
urls = 'http://www.baidu.com'
res = requests.get(url=urls, headers=headers, allow_redirects=False, timeout=10)
print(res.status_code)
html = res.text
print(type(html))
html = res.content
print(type(html))
下面来理解这个实例。
安装requests库
windows命令行下,按如下命令安装一次即可
pip install requests
导入requests库
import requests
目标请求
请求方法
get请求
例中使用的是最常用、最基础的get请求,目标地址的网页信息被赋给res对象。所以,请求的一切响应、结果都藏在res对象中。得到正确的结果,算是成功了一大步。
post请求
res = requests.post('http://httpbin.org/post', data = {'key':'value'})
post请求是第二常用请求,特点为带data关键信息。可理解为进屋敲门时自报家门,报错时,屋里的