Requests是目前公认的爬取网页最好的库,下面介绍如何安装:
以管理员身份运行命令提示符:
输入:
pip install requests
现在检查安装是否成功,以爬取百度页面为例,在python自带的IDLE下运行:
>>> import requests
>>> r = requests.get("http://www.baidu.com")
>>> r.status_code
200 # 状态码为200,表示访问成功
>>> r.encoding = 'utf-8' # 更改为utf-8编码
>>> r.text
…… # 此处显示为百度主页被成功抓取的内容
如上即为Requests库安装成功