数仓建模
xiaowei0548
单身可撩啊喂
展开
-
尚硅谷大数据项目之电商数仓(4即席查询数据仓库)
尚硅谷大数据项目之电商数仓(即席查询)(作者:尚硅谷大数据研发部)版本:V4.0第1章 Presto1.1 Presto简介1.1.1 Presto概念1.1.2 Presto架构1.1.3 Presto优缺点1.1.4 Presto、Impala性能比较https://blog.csdn.net/u012551524/article/details/79124532测试结论:Impala性能稍领先于Presto,但是Presto在数据源支持上非常丰富,包括Hive、图数据库、传统关系型原创 2020-05-13 11:51:25 · 1883 阅读 · 0 评论 -
大数据技术之Sqoop
尚硅谷大数据技术之Sqoop(作者:尚硅谷大数据研发部)版本:V2.0第1章 Sqoop简介Sqoop是一款开源的工具,主要用于在Hadoop(Hive)与传统的数据库(mysql、postgresql…)间进行数据的传递,可以将一个关系型数据库(例如: MySQL ,Oracle,Postgres等)中的数据导进到Hadoop的HDFS中,也可以将HDFS的数据导进到关系型数据库中。Sqoop项目开始于2009年,最早是作为Hadoop的一个第三方模块存在,后来为了让使用者能够快速部署,也为原创 2020-05-12 11:41:25 · 751 阅读 · 0 评论 -
模型设计
ESDK迁移:需求:总共需迁移7张报表,1封海外邮件的数据(暂不迁移)规划:1、针对各个报表,抽离出其维度和指标2、对维度和指标进行抽象3、得到各个指标取数逻辑4、模型表结构设计(用户模型,收益及成本模型)5、ETL开发6、配置模型(BI展示)7、自测数据8、调度开发9、调度上线10、业务验收难点:1、报表展示层的sql都是几百行,查询性能也不高。维护成本特高,解读起来...原创 2019-10-28 16:53:25 · 304 阅读 · 0 评论