大数据
文章平均质量分 85
toxcode
这个作者很懒,什么都没留下…
展开
-
阿里云OneData数据指标体系的一些思考
知其然知其所以然,公司的SaaS系统已沉淀上亿的商户,数仓也经过一年的改造,已基本成型,基于此做个总结。背景随着公司业务的发展,频繁迭代和跨部门的垂直业务单元变得越来越多。但由于缺乏前期规划,导致后期数仓出现了严重的数据质量问题,这给数据治理工作带来了很大的挑战。在数据仓库建设过程中,总结的问题包括如下几点:缺乏统一的业务和技术标准,如:开发规范、指标口径和交付标准不统一。 缺乏有效统一的数据质量监控,如:列值信息不完整和不准确,SLA时效无法保障等。 业务知识体系散乱不集中,导致不同研发人转载 2022-02-23 17:01:25 · 1056 阅读 · 0 评论 -
ETL工具Kettle - 核心概念(学完即上手)
Kettle核心概念:可视化编程、转换、步骤、跳、数据行、并行。转载 2021-04-01 13:24:03 · 339 阅读 · 0 评论 -
大数据 - ETL工具之Kettle初学者入门
ETL工具 Kettle的核心概念,初学者入门原创 2021-03-23 13:30:24 · 874 阅读 · 0 评论