1、创建项目
(1)根据公司内部不同业务创建不同的项目,以下根据信息流业务为例
(2)根据不同部门的所对应的数据集市创建不同项目,以下根据资管公司为例
2、项目首页统计
- 在项目管理页面点击项目相关名称
(1)任务状态统计
- 包含该项目在指定时间范围内的任务实例状态统计
- 比如现在统计20211217的任务实例状态,查看如下
- 统计得出:20211217共有13个任务实例,其中10个成功,1个失败,2的暂停,与项目首页统计相符合
(2)流程状态统计
- 包含该项目在指定时间范围内工作流实例状态统计
- 比如现在统计20211217的工作流实例状态,查看如下
- 统计得出:20211217共有4个工作流实例,其中1个成功,1个失败,2个停止,与项目首页统计相符合
(3)流程定义统计
- 包含用户创建的工作流及管理员授予该用户的工作流统计
- 通过工作流定义查看有5个工作流,与项目首页统计相符合
3、创建工作流
- 根据数仓模型创建工作流
(1)建表:运行建表脚本,一次性调度单个节点
(2)初始化:将历史数据导入入建好的表中,一次性调度单个节点,分区数据可补数
- 串行执行:资源不足时使用,防止占用整个队列资源,导致其他同学的JOB运行不了
- 并行执行:提高效率,资源充足时使用
(3)ETL作业:源系统数据如ODS层
- 使用DataX作为ETL工具
(4)公共维表:作为一致性维表建设,入DIM层
(5)银行主题数仓:根据部门进行数据集市建设,DWD,DWS,ADS层