一个简单的沪深A股分布式爬虫

4 篇文章 0 订阅
1 篇文章 0 订阅

目标

获取所有A股最近300个交易日的日K数据。

思路

通过一台 redis 数据库创建一个任务队列,存放所有的 A股股票代码,所有的爬虫共享这个队列。
爬虫程序循环不断地从队列中拿到股票代码,然后模拟请求,从东方财富网获取最近300个交易的数据,解析后,存入mysql数据库。

实现

整个程序分为两部分,RedisServer 负责从上交所、深交所获取所有的 A股股票代码,然后放入redis中的 “stock” 列表中。其中 main.py 是主要运行文件,通过 settings.py 文件配置 redis 数据库, tools.py 中存放了从上交所、深交所获取数据的具体实现方法。
文件目录
然后是 SlaveSpider, 其中 main.py 通过一个 while 循环,不停地从 redis 数据中 “stock” 列表获取股票代码,拿到股票代码后就会的调用 tools.py 中的方法,从东方财富网获取数据,经过简单处理处理后存入mysql数据库。
数据样式

使用方法

先配置 RedisServer、SalveSpider中的 settings.py 文件,改为自己的数据库地址,然后先运行 中的 main.py ,等其运行完毕后,redis 中已经有了数据,就可以在任意多的电脑上启动 SalveSpider 的 main.py。

完整代码:https://github.com/a596480606/stockSpider

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值