scrapy 开发环境搭建

scrapy 网络爬虫 环境搭建 (OSX)

访问 github scrapy 可以获得搭建网络爬虫的安装环境,但是需要翻墙

1.github 介绍了一种最快的安装命令

$ pip install scrapy
  • 但是会遇见很多的问题,需要安装一些依赖包

2.scrapy 官网 提供了 guide 引导我们安装

  • mac 自带 python
$ python --version
Python 2.7.10
  • Scrapy 依赖 如下包 lxml、parsel、w3lib、twisted (我的电脑上已经安装)

如果没有安装执行命令

$ sudo pip install lxml (可替换parsel、w3lib、twisted 如果缺少)

3.安装 Homebrew,wget

$/usr/bin/ruby -e "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/master/install)"
  • 安装wget
$ brew install wget

4.安装pip工具包

  • 第一步
$ wget https://bootstrap.pypa.io/get-pip.py
  • 第二步
$ sudo python get-pip.py

5.升级 XCODE 到最新版本

6. 安装Scrapy

  • 安装
$ sudo pip install scrapy   
  • 安装失败 会遇见如下错误
OSError: [Errno 1] Operation not permitted: '/var/folders/6t/h404bjcd5tb_4q86tpv_251rv_0h0j/T/pip-sYsqDS-uninstall/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/six-1.4.1-py2.7.egg-info'   
  • 原因分析:
    Scrapy依赖six库,但是系统的six库比较老,安装scrapy需要卸载之后安装一个新的。但是Mac OS本身也依赖six,导致无法删除,因此没有办法安装Scrapy。

  • 解决的方式:使用virtualenv来安装

$ sudo pip install virtualenv
$ virtualenv scrapyenv
$ cd scrapyenv
$ source bin/activate
$ pip install Scrapy   

作者:贱贱的杨

从此你们的路上不会孤单,还有贱贱的我


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值