采集足彩数据的问题

上个月接到一个任务,采集某平台足彩上的数据,看了下网页结构,不是很复杂。本以为就是各种类型数据量巨大,程序+单机采集一周内搞定,然而真正工作时,遇到了许许多多的小问题,主要如下:

1、访问频率限制;

2、比赛时间随时变化;

3、乱码;

4、升降级附加赛、冠军杯资格赛与正赛分开;

5、联赛数据不规范、字段长度不统一;

6、具体比赛中数据格式不统一;

7、缺失数据记录;

8、一些公司改过名;

……

前前后后有几十个小问题,主要还是因为历史数据年代跨度比较大,该网站修改自己的数据格式后很难做到统一,所以每次遇到的问题总是千奇百怪,一个小小的问题可能需要一整天的时间去发现,这时需要修改程序进行容错处理,这里又要强调下容错的问题:容错多了,可能有的地方遇到错误,程序不报错但是数据没有真正获取到;容错少了,下次又出现相同的格式问题再次报错。

还好,在约定周期内顺利完成了所有任务,用户非常满意。

  • 2
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

sundayhost

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值