大数据-概述
文章平均质量分 76
OkidoGreen
这个作者很懒,什么都没留下…
展开
-
数仓-拉链表的详细实现过程
目录 目录 1-什么是拉链表 2-为什么要做拉链表 2.1-如何使用拉链表 3-拉链表的形成过程 4-拉链表的制作过程 4.1-初始化拉链表(首次独立执行) 4.2-制作当日变动数据(包括新增,修改)每日执行 4.3-先合并变动信息,再追加新增信息,插入到临时表中 4.4-把临时表覆盖给拉链表 5-总结 1-什么是拉链表 本文以订单拉链表为例进行详细讲解。 2-为什么要做拉链表 2.1-如何使用拉链表 3-拉链表的形成过程 4-拉链表的制.转载 2022-04-28 18:42:48 · 3756 阅读 · 2 评论 -
如何用形象的比喻描述大数据的技术生态?Hadoop、Hive、Spark 之间是什么关系?
作者:Xiaoyu Ma 链接:https://www.zhihu.com/question/27974418/answer/38965760 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 大数据本身是个很宽泛的概念,Hadoop生态圈(或者泛生态圈)基本上都是为了处理超过单机尺度的数据处理而诞生的。你可以把它比作一个厨房所以需要的各种工具。转载 2017-09-11 10:39:13 · 810 阅读 · 0 评论 -
OLAP OLTP presto、druid、sparkSQL、kylin的对比分析,如性能、架构等,有什么异同?
https://www.zhihu.com/question/41541395?sort=created https://www.cnblogs.com/andy6/p/6011959.html OLTP和OLAP的区别 联机事务处理OLTP(on-line transaction processing) 主要是执行基本日常的事务处理,比如数据库记录的增删查改。比如在银行转载 2017-11-22 17:59:52 · 12698 阅读 · 0 评论 -
为什么列存储数据库读取速度会比传统的行数据库快?
https://www.zhihu.com/question/29380943 作者:李伟 链接:https://www.zhihu.com/question/29380943/answer/48516239 来源:知乎 著作权归作者所有。商业转载请联系作者获得授权,非商业转载请注明出处。 如果懒得看分析直接看结论: 列存储的数据库更适合OLAP 行存储的数据库更转载 2017-11-23 18:23:44 · 5493 阅读 · 0 评论