没有必要重新造轮子,可以考虑直接用阿里云的镜像。 我做了一个镜像, Python 3.5 + Scrapy 1.3 全都装好了, Scrapy Bench 测试也通过了。
我这两天在学习Scrapy爬虫的东西。 按照网络上的教程,花了2-3天时间才全部装好。
如果有人用Aliyun平台,可以直接用这个镜像。 如果从头开始装的话,建议
1. 基础镜像 Centos 7.2 (64位)
2. 提前准备编译环境
yum groupinstall 'Development Tools'
yum install zlib-devel bzip2-devel openssl openssl-devel ncurese-devel (注:Twisted,安装不成功后,发现缺少上面依赖)
yum install libffi-devel python-devel (注: cryptography安装不成功后,发现缺少上面依赖)
3.升级Python 到3.5(系统默认是2.7)
tar -xvf Python-3.5.3.tgz
cd ./Python-3.5.3
./configure --prefix=/usr/local/python3 --enable-loadable-sqlite-extensions
make && make altinstall (make install 不能成功,Sqllite总是出问题)
4. 更换系统默认 Python 版本
mv /usr/bin/python /usr/bin/python2.7 (备份)
ln -s /usr/local/python3/bin/pip3 /usr/bin/pip
ln -s /usr/local/python3/bin/python3.5 /usr/bin/python
5.更新 yum 相关设置
因 yum 的功能依赖 Python2 更改默认 Python版本后会导致 yum无法正常工作 执行以下命令: vi /usr/bin/yum 打开文件,修改第一行为: #!/usr/bin/python2.7
此外还有一个文件也需要修改成#!/usr/bin/python2.7 (/usr/libexec/urlgrabber-ext-down)
6. 安装Scrapy
pip install scrapy.
大致过程就是上面。 考虑到Python2 系列和Python3 系列的Scrapy安装有很多细节不太一样。实际按照Scrapy还会遇到 Twisted, Sqlite3 版本和编译问题。
花了2天时间,我的Scrapy总算装好了。 如果你的时间很宝贵也不想折腾,那么你就直接用我做好的镜像。 这个镜像只能在阿里云上使用。 需要的话可以私信,此镜像只用于学习之用。 我自己用的镜像按使用量计算,每小时0.21元,目前一共用了5元。不用的时候,资源释放掉,不花 钱。
此外,广告如下:
修改