目录
在前面的文章,详细介绍了如果监测mysql或hive当天或当月的表,看是否跑出数据,如果没有跑出数据,就如何调用海豚调度器的api来自动启动工作流。可参考下面的2篇文章。
海豚调度器自动监测每日报表及自动重跑异常工作流(综合应用可用代码
不过在实际中应用场景中,特别是新的离线数仓的项目,通常是需要跑历史数据。如果涉及表多的话,一个个手动检测很耗时间。下面提对前面的检测当天报表的代码进行升级,自动化地检查特定日期范围内多个数据库表的数据完整性,并记录缺失的数据日期到mysql中。
代码思路如下:
1、看某张表的所有有数据的日期
通过下面的sql来检测指定日期到昨天,某个表有数据的日期
SELECT stat_date FROM tb1 WHERE stat_date BE