数据咩
一只计算机专业,从业python,但是在干大数据的羊
展开
-
数仓建模之维度建模
其中粒度是非常重要的,粒度用于确定事实表的行表示什么,建议从关注原子级别的粒度数据开始设计,因为原子粒度能够承受无法预估的用户查询,而且原子数据可以以各种可能的方式进行上卷,而一旦选择了高粒度,则无法满足用户下钻细节的需求。事实是整个维度建模的核心,其中雪花模型或者星型模型都是基于一张事实表通过外健关联维表进行扩展,生成一份能够支撑可预知查询需求的模型宽表,而且最后的查询也是落在事实表中进行。原创 2023-08-14 20:45:20 · 138 阅读 · 0 评论 -
数仓搭建第四步——主题域划分
那么数仓产生的方法论就是将具体问题步骤化,类别化,层次化。这其中就涵盖了主题域的划分,划分主题域有利于区分数据在某一种类别或渠道的不同,让整个数仓架构清晰化,便于后期对数据的利用与开发。原创 2022-11-01 21:32:59 · 814 阅读 · 1 评论 -
数仓搭建第三步——建立规范
数仓搭建第三步——建立规范原创 2022-10-26 17:04:08 · 501 阅读 · 0 评论 -
数仓搭建第二步——根据第一步招揽相关人员
数仓搭建第二步——根据第一步招揽相关人员原创 2022-10-26 11:59:51 · 147 阅读 · 0 评论 -
从零搭建数仓第一步——明确数仓用途与目的
从零搭建数仓第一步——明确数仓用途与目的原创 2022-10-26 11:57:48 · 361 阅读 · 0 评论 -
数仓0-1搭建过程
1 明确数仓用途与目的2 根据第一步招揽相关人员3 建立相关规范包括但不限于表名字段、sql、安全、测试、报警、依赖、建模等规范4 根据第一步与公司业务划分主题5 明确数仓层级6 根据公司现状选择相关工具包括但不限于数据同步工具、数据处理工具、数据存储工具等原创 2022-09-09 10:09:15 · 630 阅读 · 0 评论 -
大数据001——数仓搭建相关
hive建表语句CREATE EXTERNAL TABLE db.table_name(field typeCOMMENT '描述')原创 2021-06-12 14:44:44 · 309 阅读 · 4 评论