很多小伙伴在学习python爬虫的时候都会被要装各种各样的包和库而烦恼,终于今天自己也踏上了这条征程。写了这篇文章,希望可以帮助到一起学习的小伙伴。
爬虫可以简单分为几步:抓取页面、分析页面、存储数据。所以在第一步抓取页面的过程中,我们就需要模拟浏览器向服务器发出请求,所以需要用到一些 Python 库来实现 HTTP 请求操作。
-
requests安装
由于 Requests 属于第三方库,也就是 Python 默认不会自带这个库,需要我们手动去安装,下面我们首先看一下它的安装过程。
- 安装pip
GitHub:https://github.com/requests/requests
一般情况,在安装python时就会自带包管理工具pip,安装python后设置环境变量,就可以直接在命令行打出命令安装。
pip install requests
一会就安装成功了。
这时你可以进入命令行在python环境下, 输入:
import requests
没有报错就说明安装成功了。
-
selenium安装
和requests一样,同样可以通过pip安装
pip install selenium
当然,如果担心没有安装成功的话,也可以验证一番,在命令行输入:
import selenium
没有报错就可以了。
这样就OK了