离线数据开发之数据开发平台

数据研发岗位日常工作内容:
了解需求 --> 模型设计 --> ETL开发 --> 测试 --> 发布上线 --> 日常运维 --> 任务下线
在这里插入图片描述
1)架构在这里插入图片描述
① 客户端:多种方式操作数据
在这里插入图片描述
② 接入层:提供Http服务、负载均衡、用户认证、用户访问控制

③ 逻辑层:即控制层,完成命令解析、执行逻辑控制、数据对象管理,包含三个组件:
在这里插入图片描述
④ 计算层:专门用于计算的集群,包括
在这里插入图片描述
2)统一开发平台
离线数据开发除数据计算平台之外还需要多个子系统解决各种数据开发中遇到的问题,保证任务开发、测试、发布、监控、运维的顺利进行。具体包括以下系统:
在这里插入图片描述
① 数据开发平台:作为数据处理的工作台,集成数据开发、调试、发布、任务调度等功能。

② 任务代码规范检查平台:
在这里插入图片描述
③ 数据质量控制平台:
在这里插入图片描述
④ 自动化测试平台:将重复、通用的操作由自动化测试平台完成,提高测试效率,具体功能如下:

  • 数据对比:对源数据和目标数据进行对比,包括数据量、重要字段统计值、字段空值、字段枚举值等。

  • 数据分布:提取表和字段的特征值与预期结果进行对比。

  • 数据脱敏:线上数据脱敏。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值