注文章参考公众号:大数据技术派
数仓工作中的常见问题及解决方案
https://mp.weixin.qq.com/s/zMt6v80-Koge7J7K1D1g9w
目录
一.数据仓库现状
业务增长速度快,取数需求激增、下游应用场景对数据质量、响应速度、数据时效性的要求越来越高。根据数仓数据的流转链路,从业务系统侧[【上游】->数仓内部->数据应用【下游】、梳理各环节存在的问题。(数仓建设中遇到什么难题?业务方面,技术方面)
1.1业务系统侧【上游】
数据仓库首先需要对业务系统的结构化数据、日志数据及埋点数据等进行汇聚。在对接过程中,主要存在以下问题:
- 缺乏业务系统数据变更的通知机制:针对已经入仓的业务系统数据、后期结构发生变更(例如:表的schema信息变更)没有及时告知数仓,而是下游用数者发现问题后通知数仓(数仓很容易背锅)。
订阅专栏 解锁全文
2186

被折叠的 条评论
为什么被折叠?



