python小爬虫第一步——Requests库初识
对于一个小爬虫,python为我们提供了requests库来让我们来简单调用使用。
今天刚刚了解了requests库
windos下的Requests的安装
cmd命令指示符中输入:pip install requests
requests库的简单使用举例 :
requests.request()
这是最基本的请求,支撑一下请求方法,也可以说下面的方法都是这个的简化版本。
requests.get() HTTP中get请求一致。
requests.head() HTTP中获取网页头的方法。
requests.post() requests.put() requests.patch() requests.delete()
详情参考http协议
Response对象的属性
**|.status_code | HTTP请求返回状态|
|.text | HTTP响应内容-|
| .encoding | 从内容中分析编码方式 |
| .apparent_encoding | 从内容中分析编码方式 |
举个栗子,简单分析一下requests.get()吧
- 首先用 import requests 语句调用requests库
- 使用 r = requests.get(“url”),将获取相应网页中内容放在r中
比如访问www.baidu.com - 接着使用r.status_code 获取状态 返回200 表示正常
- 接下来一般使用 r.encoding = r.apparent_encoding
或者中文的话 r.encoding=’utf-8’ 编码就可以了 - 最后用 r.text 就可以看见我们的收获了。
- 其实requests.get()里面还可以放一些参数,大家有兴趣可以再查查。