Request库是目前公认的爬取网页最好的第三方库(简单、简洁)
# 详情信息请看:http://www.python-requests.org
# 本文为学习北京理工大学慕课笔记 #
一、Request库安装方法
win+R,输入cmd,管理员身份启动控制台
键入 pip install requests,进行安装
pip install requests
二、测试requests库的安装效果
在命令行中键入python,然后键入以下信息,访问百度主页
import requests
r = requests.get("http://www.baidu.com")
r.status_code
可以看到返回的状态码为200,表示访问成功!
更改一下编码,并打印出来
r.encoding = 'utf-8'
r.text
可以看到百度主页已经被成功抓取!