1.Scrapy库安装
Scrapy的安装有多种方式,它支持Python2.7版本及以上或Python3.3版本及以上。下面说明Python3 环境下的安装过程。
Scrapy依赖的库比较多,至少需要依赖库有Twisted 14.0, lxml 3.4, pyOpenSSL 0.14。而在不同平 台环境又各不相同,所以在安装之前最好确保把一些基本库安装好,尤其是Windows。
2.Anaconda
这种方法是一种比较简单的安装Scrapy的方法(尤其是对Windows来说),你可以使用该方法安装, 也可以选用下文中专用平台的安装方法。
Anaconda是包含了常用的数据科学库的Pytho n发行版本,如果没有安装,可以到https://www.continuum.io/downloads 下载对应平台的包安装。
如果已经安装,那么可以轻松地通过conda命令安装Scrapy。
安装命令如下:
conda install Scrapy
3.Windows下其他方法的安装
3.1 安装lxml
最好的安装方式是通过wheel文件来安装,http://www.lfd.uci.edu/~gohlke/pythonlibs/,从该网站找 到lxml的相关文件。假如是Python3.5版本,WIndows 64位系统,那就找到
仪ml-3.7.2-cp35-cp35m-win_amd64.whl这个文件并下载,然后通过pip安装。
Lxml, a binding for the Iibxml2 and libxslt libraries.
lxml-3.7.2-CD27-CD27m-win32.whl
Ixm卜3.7.2-CD27-CD27m-win amd64.whl
lxml-3.7.2-CD34-CD34m-win32.whl
lxml-3.7.2-CD34-CD34m-win amd64.whl
lxml-3.7.2-CD35-CD35m-win32.whl
lxml-3.7.2-CD35-CD35m-win amd64.whl
lxml-3.7.2-CD36-co36in-wi n32.whl
lxml-3.7.2-CD36-CD36in-win amd64.whl
下载之后,运行如下命令安装:
pip3 install wheel
pip3 install lxml-3.7.2-cp35-cp35m-win_amd64.whl
即可完成lxm l的安装,其他文件替换文件名即可。
3.2 安装 pyOpenSSL
官方网站下载wheel文件,https://pypi.python.org/pypi/pyOpenSSL#downloads,如当前最新版本 名称是pyOpenSSL-16.2.0-py2.py3-none-any.whl,下载后安装即可。
pip3 install pyOpenSSL-16.2.0-py2.py3-none-any.whl
3.3 安装 Twisted
同理,http://www.lfd.uci.edu/〜gohlke/pythonlibs/#twisted下载wheeI文件,利用pip安装即可。
如Python 3.5版本,Windows 64位系统,下载 Twisted-17.1.0・cp35・cp35m-win_amd64.whl,然后 pip安装。
pip3 install Twisted-17.1.0-cp35-cp35m-win_amd64.whl
3.4 安装 pywin32
从官方网站 https://sourceforge.net/projects/pywin32/fiIes/pywin32/BuiId%20220/ 下载对应版本 的安装包安装即可。
3.5 安装 Scrapy
最后安装Scrapy即可,依然使用pip,命令如下:
pip3 install Scrapy