读书笔记二 ---大数据之路

开发平台:

SQLSCAN:代码检测
SQLSCAN根据所配置的规则执行相应的规则校验。
SQLSCAN将检查成功或者失败的信息传回D2.
D2的IDE显示OK (成功) 、WARNNING (警告) 、FAILED(失败,禁止用户提交)等消息。
SQLSCAN主要有如下三类规则校验:
代码规范类规则,如表命名规范、生命周期设置、表注释等。
代码质量类规则,如调度参数使用检查、分母为0提醒、NULL值参与计算影响结果提醒、插入字段顺序错误等。
代码性能类规则,如分区裁剪失效、扫描大表提醒、重复计算检测等.
SOLSCAN规则有强规则和弱规则两类。触发强规则后,任务的提交会被阻断,必须修复代码后才能再次提交,而触发弱规则,则只会显示违反规则的提示,用户可以继续提交任务。

DQC:有数据监控和数据清洗的功能(美团的只要数据监控,而无数据清洗的功能)
数据清洗:将不符合规定的数据清洗掉,以保证最终数据产出不含“脏数据”,数据清洗不会出发报警(这一步为何不在数据开发的时候完成?)

在彼岸:数据测试
数据量对比,主键重复,字段为空,枚举,数据量差异对比,字段值差异对比。。。。。(个人觉得测的越多越好)

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值