突发奇想,想用爬虫抓取下股票价格之类的数据,万一以后有新投资品种,可以通过爬虫获得第一手数据,不用等待市场的公开接口。这样新品种也可以结合策略直接开跑了。调研了下,决定用pyspider(网络爬虫也是研究生实验室一个方向,所以略懂好一些)
pyspider安装教程
1,创建虚拟环境pyspider
conda create -n pyspider python=3.5
2,安装pyspider
source activate pyspider
pip install pyspider
3,执行pyspider
pyspider
报错:
ImportError: pycurl: libcurl link-time version (7.58.0) is older than compile-time version (7.63.0)
问题:版本过旧
解决:
pip uninstall pycurl
conda Install pycurl(conda处理依赖更佳,这里使用pip依然是旧版)
再试试pyspider
ValueError: Invalid configuration:
- Deprecated option 'domaincontroller': use 'http_authenticator.domain_controller' instead.
参考:https://blog.csdn.net/SiHann/article/details/88239892
执行:
pip install wsgidav==2.4.1
再试试pyspider,成功启动,成熟开源产品就是省事啊,想想vnpy的安装,都是泪。。