欢迎关注公众号——《数据三分钟》
一线大厂的师兄师姐结合自己的工作实践,将数据知识浅显道来,每天三分钟,助你成为数据达人。还有面试指导和内推机会。
传统的LAMDA架构取得了辉煌的成就,大大小小的公司几乎都以LAMDA为模版构建了自己的数据仓库,但是LAMDA架构的缺陷也一直被数据人诟病——由于实时链路和离线链路采用不同的计算引擎,在数据研发的过程中,不得不开发、维护两套代码,不仅开发成本高,而且得时刻保持口径的一致,不然就会造成严重的数据质量问题。在传统的LAMDA架构中,实时与离线数据,一般由两班人马开发维护,很难保证数据口径、代码逻辑的严格一致,研发效能受到了很大的挑战。而千呼万唤始出来的流批一体技术,从根本上解决了这个问题,实时离线真正意义上合并统一,用一套代码跑出两套数据,最大程度上提高了开发效率。
0、插一段历史
汉初,开国大将周勃铲除诸吕之乱,准备新立一个皇帝,选了又选,决定让傻白甜刘恒即位,可谁知刘恒却是个聪明人,正是多年来在吕雉面前装傻卖乖才免于一死,平安在代地做诸侯王。周勃在都城外迎接刘恒时,想套个近乎,提醒一下刘恒自己的功劳,于是对刘恒说想借一步说话,却直接被刘恒怼了回