除了内建的模块外,Python还有大量的第三方模块。本章介绍一种常用的第三方模块:requests。Python有内置的urllib模块,用于访问网络资源。但是,它用起来比较麻烦,而且,缺少很多实用的高级功能。更好的方案是使用requests。它是一个Python第三方库,处理URL资源特别方便。
安装requests
pip install requests
可以在pycharm终端敲入。就可以直接安装。值得提一下。requests库使用的是国外的源。下载速度比较慢可以换成国内的如阿里源,清华源等
pip install -i https://pypi.tuna.tsinghua.edu.cn/simple requests
还有这些源可以用:
阿里云:http://mirrors.aliyun.com/pypi/simple/
豆瓣:http://pypi.douban.com/simple/
国内镜像下载
永久修改,一劳永逸:
linux下,修改 ~/.pip/pip.conf (没有就创建一个), 修改 index-url至tuna,内容如下:
[global] index-url = https://pypi.tuna.tsinghua.edu.cn/simple
windows下,直接在user目录中创建一个pip目录,如:C:\Users\xx\pip,新建文件pip.ini,内容如下
[global] index-url = https://pypi.tuna.tsinghua.edu.cn/simple
使用requests
要通过GET访问一个页面,只需要几行代码:
import requests
r = requests.get('https://www.baidu.com/')
r.status_code
print(r.content.decode("utf-8"))
requests自动检测编码,可以使用encoding属性查看:
r = requests.get('https://www.baidu.com/')
r.status_code
r.encoding
#print(r.content.decode("utf-8"))
print(r.encoding)
可以看出百度使用的是ISO-8859-1编码