演讲者为靳国卫,快手大数据研发专家,负责用户增长数据团队
分为3部分介绍Hudi如何解决效率问题,首先是实际应用中遇到的痛点有哪些,业务诉求是什么,然后调研业界的解决方案,为什么选择Hudi来解决痛点问题,然后介绍在实践中如何使用Hud解决业务问题,并形成体系化的解决方案。
业务痛点包括数据调度、数据同步和修复回刷三大类痛点,包括数据全量回刷效率低。
三个场景通用来看,从业务诉求就是希望更快看到结果,像业务库那样数据准备好了就可以使用,由于业务库引擎限制,又希望使用大数据技术做分析,总的来看可以结合实时化和大数据的CRUD合并。
在业界进行调研后,发现有一些解决方