1.概述
本系列介绍如何使用python进行网络爬虫,现在在网络上有大堆的资源可以查阅,我写这个系列的目的主要是为了增加自身的知识记忆,同时也建立一个供网络查询的“仓库”,本篇首先介绍在windows下相关python库lxml,BeautifulSoup4和Requests安装准备,以便后期使用pycharm作为代码编译器进行实际操作。[本文操作情况下默认已经安装python3,pip3工具以及pycharm]
2.lxml库安装
a.下载lxml库(下载地址:点击打开链接)
b.在网站中搜索(ctrl+F)"lxml",得到如下图:
c.针对自己电脑安装的python版本及系统版本下载相应.whl文件(我的电脑是python3.6.0/64系统,我选最后一个lxml库)
d.以管理员方式启动命令行,安装.whl文件
3.BeautifulSoup4库安装
a.以管理员方式启动命令行,运用pip3安装
4.Requests库安装
a.以管理员方式启动命令行,运用pip3安装