首先以管理员身份打开命令提示符,输入pip install requests,安装requests库,然后在IDLE环境中测试安装效果,输入内容:
可以直接用jupyter,无需安装requests库,在jupyter notebook中直接输入以下代码即可
import requests##requests库是python的第三方库,公认的爬取网页最好的库
r = requests.get("http://baidu.com")#以访问百度主页为例
r.status_code#查看状态码
得到状态码为200,表示访问成功
再更改它的编码为utf-8编码
打印网页内容
r.encoding='utf-8'#更改它的编码为utf-8编码
r.text#打印网页内容
爬搜狗
#爬搜狗
s = requests.get("https://www.sogou.com/")
s.status_code
问题:改编码有什么用?不改好像也有结果诶
不过还是改了好,对后面应该会有影响
s.text
遇到的问题:
我在安装时发现pip版本过低,可输入python -m pip install --upgrade pip命令进行更新,然后再安装requests库。