爬虫可以简单分为几步:抓取页面、分析页面、存储数据。
在第一步抓取页面的过程中,我们就需要模拟浏览器向服务器发出请求,所以需要用到一些 Python 库来实现 HTTP 请求操作,在本书中我们用到的第三方库有 Requests、Selenium、Aiotttp 等。
在本节我们介绍一下这些请求库的安装方法。
成长离不开与优秀的同伴共同交流,如果你需要好的学习环境,好的学习资源,这里欢迎每一位热爱Python的小伙伴
1.1.1 Requests的安装
由于 Requests 属于第三方库,也就是 Python 默认不会自带这个库,需要我们手动去安装,下面我们首先看一下它的安装过程。
1. 相关链接
- GitHub:https://github.com/requests/r...
- PyPy:https://pypi.python.org/pypi/...
- 官方文档:http://www.python-requests.org
- 中文文档:http://docs.python-requests.o...
2. 安装
pip3 install requests
3. 验证安装
为了验证库是否已经