pyspider+phantomjs


安装pyspider包

  • pip install pyspider

配置文件编辑

  • config.json
    官方建议以配置文件的方式运行,当然也可以 通过命令行的方式来运行,具体查看 pyspider --help公共参数 或者 pyspider webui --help查看指定组件的参数

  • 配置文件格式

    {
    "taskdb": "mysql+taskdb://username:password@host:port/taskdb",
    "projectdb": "mysql+projectdb://username:password@host:port/projectdb",
    "resultdb": "mysql+resultdb://username:password@host:port/resultdb",
    "message_queue": "amqp://username:password@host:port/%2F",
    "webui": {
    "username": "some_name",
    "password": "some_passwd",
    "need-auth": true
    }
    }
    

    taskdb, projectdb, resultdb

wsgiDAV 3.0.3
Werkzerg 0.14.1

问题收集
  • TypeError: initialize() got an unexpected keyword argument ‘io_loop’
    原因:python环境中,默认tornado版本是最新的5.0,在4.0之后就废弃了io_loop参数。

    解决方法:

      1、pip uninstall tornado
    
      2、pip install tornado==4.1
    
  • Deprecated option ‘domaincontroller’: use ‘http_authenticator.domain_controller’ instead.

    把 ‘domaincontroller’: NeedAuthController(app), 修改为:

    ‘http_authenticator’:{
    ‘HTTPAuthenticator’:NeedAuthController(app),

  • ImportError: cannot import name ‘DispatcherMiddleware’

    #卸载
    python -m pip uninstall werkzeug
    #安装指定版本
    python -m pip install werkzeug==0.16.0

  • /usr/lib/python2.7/site-packages/pyquery/pyquery.py 进行了降级 1.4.1

  • /usr/lib/python2.7/site-packages/pyspider/database/sqlite/sqlitebase.py 加打印看了下 用的相对路径


安装phantomjs

安装包版本 phantomjs-2.1.0-linux-x86_64.tar
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值