白龙马科技大数据面试题

本文探讨了数据仓库的相关问题,包括数据同步、数据漂移解决方案、增量同步与全量同步策略。同时,阐述了Spark的核心功能应用,并深入到事实表分类、维度建模指标设计以及数据仓库设计方案。针对增量数据业务表变化,提出了确保统计准确性的方法,最后讲解了指标和维度的设计与维护,以及拉链表同步流程。
摘要由CSDN通过智能技术生成
1.自我介绍
2.数据仓库相关的问题
3.怎么去同步数据
4.通过流同步数据发生数据漂移问题怎么解决
5.增量同步或全量同步的表处理方案
6.spark大概用到了哪些功能
7.事实表的分类
8.维度建模指标的考虑
9.数据仓库的设计方案
10.增量的数据业务表变化怎么保证数据统计不会发生错误
11.介绍下指标和维度怎么设计的
12.指标和维度怎么维护的
13.拉链表的同步流程
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 4
    评论
评论 4
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值