数据仓库
文章平均质量分 94
李奇峰1998
吾生也有涯,而知也无涯
展开
-
【实战】元数据管理落地实施
我是谁,我从哪里来,我要到哪里去,我会做什么,我能做什么?我时常反思这些问题,才不至于在快速发展的社会中迷失。作为数据从业者,我们也需要探查数据的本质,并对其进行追踪、登记、管理,才不至于在海量数据中迷失。今天这篇文章将会详细介绍描述数据的数据:元数据,并给出具体的落地实施方案。原创 2022-10-24 22:04:04 · 1400 阅读 · 3 评论 -
【实战讲解】数据血缘落地实施
在复杂的社会分工协作体系中,我们需要明确个人定位,才能更好的发挥价值,数据也是一样,于是,数据血缘应运而生。今天这篇文章会全方位的讲解数据血缘,并且给出具体的落地实施方案。........................原创 2022-07-24 16:38:29 · 5472 阅读 · 5 评论 -
【思考】数据资产管理痛点以及解决思路
文章中所有内容均为本人从事大数据行业以来,所遇到的数据开发-数据仓库-数据管理方向所暴露出来的通用性问题以及思考后总结的一些解决思路,无关具体行业与业务。希望自己的思考可以给各位同仁提供一些微不足道的参考。一、痛点总结1.1 元数据层面目前很多公司亦或是不重视或是不存在元数据层面的管理,殊不知作为大数据中老生常谈的内容,其存在的必要性以及其对数据管理的有效性。元数据作为记录数据的数据,随着公司数据资产的增加,需要对其进行有效的管理,从而能够快速获取到数据的相关信息并进行使用。包括数据在哪里.原创 2022-05-08 18:08:19 · 2578 阅读 · 2 评论 -
【2022持续更新】大数据最全知识点整理-数据仓库篇
大数据最全知识点整理-数据仓库篇1、什么是数据仓库(数仓的定义)2、数据仓库特点面向主题集成性稳定性反映历史变化3、数据库和数据仓库的区别4、数仓构建流程1) 数据调研、划分主题域2) 明确统计指标3) 构建总线矩阵4) 构建明细模型5) 构建汇总模型6) ETL以及代码实现7) 数仓应用、结果验证8) 数仓管理5、数仓分层概述6、数仓为什么要分层把复杂问题简单化清晰数据结构:空间换时间、减少重复开发。数据之间解耦合:7、维度建模选择:星型、雪花、星座星型模型雪花模型星座模型比较8、缓慢变化维处理9、拉链表原创 2022-01-19 09:54:45 · 5867 阅读 · 40 评论