1、requests 库简介
Urllib 和 requests 模块是发起 http 请求最常见的模块。
虽然 Python 的标准库中 urllib 模块已经包含了平常我们使用的大多数功能,但是它的
API 使用起来让人感觉不太好,而 Requests 自称 “HTTP for Humans”,说明使用更简洁方便。
Requests 继承了 urllib 的所有特性。Requests 支持 HTTP 连接保持和连接池,支持使用 cookie 保持会话,支持文件上传,支持自动确定响应内容的编码,支持国际化的 URL 和 POST 数据自动编码。
requests 的底层实现其实就是 urllib3(urllib2 的升级版—python2 支持)
开源地址:https://github.com/kennethreitz/requests
中文文档 API: http://docs.python-requests.org/zh_CN/latest/index.html
2、安装方式
利用 pip 安装 或者利用 easy_install 都可以完成安装:
pip install requests
3. Requests get 请求
3.1爬取百度产品
示例:
分析:
我们在发起 get 请求的时候 requests 提供了两种方式,分别是 get 和 request,达到的效果类似。Requests 会自动解码来自服务器的内容。大多数 unicode字符集都能被无缝地解码。对于不能解码的,你可以字节的方式访问请求响应体,对于非文本请求。然后对 文本进行解码。