- 含义:对数据集的数据进行一定规则的分析,查看不符合规则的坏数据的状态及概率,用不同的形式展现出来
- 分析规则
- 内置规则:13种内置规则,,,,字段符合移动电话格式等
- 自定义规则:手动创建有三种自定义类型:el , Extend, sql
- 新建/编辑规则:(自定义数据)
- EL:
- 表达式就是正则表达式,
- 输入字段类型: 可以指定字符串,数字日期,不限定
- Extend:
- 表达式就是正则表达式,
- 输入字段类型: 可以指定字符串,数字日期,不限定
- 基类:选一个已经存在的规则,指定从哪个规则基础上扩展
- SQL:
- 输入字段类型: 可以指定字符串,数字日期,不限定
- EL:
- 修改:
- 新建以弹框形式
- 新建form,主键字段不显示,描述放在name下面
- 左侧树结构去掉,分成是否筛选框,和自定义类型筛选框(EL,UDF,Extend,SQL )
- 分析模板
- 预处理流程:
- 可以在dataset运行前进行一次数据预处理,
- 预处理流程只能是dataflow,
- sink指定的dataset必须和模板选定的dataset是同一个才会生效
- 编辑规则
- name和数据集都填写完成之后才能点击编辑规则按钮,编辑规则之前,先调用保存接口
- 跳转到指定模板的规则管理页面,查看跳转到模板详情页面,运行中改成运行
- 运行和执行计划和flow的差不多
- 任务:
- 根据指定的模板跳转到对应的任务执行信息页面
- 修改
- 流程类型:指的是预处理流程的类型,可以放到flow选择弹框添加筛选调教,不在模板新建页面指定此西段
- 新建模板,form预处理流程字段只展示name,不需要主键
- 预处理流程:
- 任务执行信息
- 模板名称:显示新建模板弹框,form字段disabled
- name: 任务执行详情弹框的form
- 结果: 执行后分析列表,跳转到新窗口显示table的页面
- 主键: 改成查看日志的操作按钮, 跳转到flow的日志路由
- 评估结果统计
- 数据列表
- 根据统计方式和统计项还有时间进行数据筛选
- 图形
- 质量等级和坏数据率两个数据进行平衡军属最大值最小值等展示
- 数据列表
数据治理的逻辑梳理
最新推荐文章于 2024-01-01 12:47:42 发布