数据仓库
文章平均质量分 83
维克先生
我与代码,是一场美丽的邂逅!
展开
-
阿里云 - MaxCompute研究
MaxCompute是适用于数据分析场景的企业级SaaS(Software as a Service)模式云数据仓库,提供离线和流式数据的接入,支持大规模数据计算及查询加速能力。MaxCompute适用于100 GB以上规模的存储及计算需求,最大可达EB级别,适用于大型互联网企业的数据仓库和BI分析、网站的日志分析、电子商务网站的交易分析、用户特征和兴趣挖掘等。原创 2023-01-13 15:42:53 · 1402 阅读 · 1 评论 -
数仓知识12:PostgreSQL预写日志(WAL)和逻辑解码方案
了解PostgreSQL预写日志(WAL)是什么,研究分析PostgreSQL各种逻辑解码方案间的差异原创 2022-09-19 21:17:05 · 1451 阅读 · 0 评论 -
数仓知识11:Hadoop生态及Hive、HBase、Impala、HDFS之间的关系
Hive、HBase、Impala、HDFS是Hadoop生态体系中常用的开源产品,各个产品间是一个什么样的关系,许多人都搞不清楚,本文将进行研究分析。原创 2022-09-16 20:40:16 · 3491 阅读 · 1 评论 -
数仓知识10:数据库存储的两种方式-行存储和列存储
目前大数据存储主要有两种方案可供选择:行存储(Row-Based)和列存储(Column-Based)。业界对两种方案有许多争持,争论的焦点是:谁能够更有效地处理海量数据,且兼顾安全、可靠、完整性。原创 2022-06-19 18:24:36 · 5452 阅读 · 0 评论 -
数仓知识09:数据仓库的概念
1.数据仓库概念数据仓库,Data Warehouse,简写为DW或DWH。定义:面向主题的,集成的,相对稳定的,反映历史变化的数据集合,用于支持管理决策。面向主题:在较高层次上将企业信息系统的数据综合归并进行分析利用的抽象的概念。每个主题基本上对应一个相应的分析领域 集成的:企业级数据,同时数据要保持一致性、完整性、有效性、精确性 稳定的:从某个时间段来看是保持不变的,没有更新操作、删除操作,以查询分析为主 变化的:反映历史变化2.数据仓库和数据库的区别3.不...原创 2022-05-01 16:17:13 · 2023 阅读 · 0 评论 -
数仓知识08:数据中台概念
1.中台是什么?中台这个概念早期是由美军的作战体系演化而来的,技术上所说的“中台”主要是指学习这种高效、灵活和强大的指挥作战体系。中台就是:通过制定标准和机制,把不确定的业务规则和流程通过工业化和市场化的手段确定下来,以减少人与人之间的沟通成本,同时还能最大程度地提升协作效率。原则:集中管控,分布式执行目标:提高企业快速低成本创新的能力,减少沟通成本,提升协作效率2. 数据中台是什么?数据中台是数据服务(Data API)工厂,打造高数据响应力的企业。数据中台是指通过数据技术,.原创 2022-05-01 16:12:12 · 769 阅读 · 0 评论 -
数仓知识07:数据增量更新的几种方式
1、增量更新的几种方式增量更新的本质,其实是获取源表中数据变化的情况(增、删、改),然后将源表中发生的变化同步至目标表中。不同的方式,获取源表中数据变化的情况不一样,受技术的限制、表结构的限制,某些方式可能无法获取到完整的数据变化情况,因此只能适用于特定的场景。方式 简述 适用场景 详述 优点 缺点 时间戳增量1 记录每次读数完成时的最大时间戳,后续读数时只获取源头表中新增的数据,将其增量写入到目标表。 源表只增不删不改原创 2022-05-01 16:08:50 · 9768 阅读 · 2 评论 -
数仓知识06:什么是元数据?
1.概念元数据(Metadata),又称中介数据、中继数据,为描述数据的数据(data about data),主要是描述数据属性(property)的信息,用来支持如指示存储位置、历史数据、资源查找、文件记录等功能。举几个简单例子:如果一本书是一个“数据",那么它的书名、封面、出版社、作者、总页码就是它的“元数据”。 如果一个电影是一个“数据”,那么它的总时长、制作人、总导演、演员列表就是它的“元数据”。 如果数据库中某个表是一个”数据”,那么它的列名、列类型、列长度、表注释就是它的"元.原创 2022-05-01 16:05:11 · 7569 阅读 · 3 评论 -
数仓知识05:事实表和维度表的概念
数仓中通常有两种表:事实表、维度表,这两种表是什么含义,有哪些区别,今天进行讲解。事实表数据仓库架构中的中央表,它包含联系事实与维度表的数字度量值和键。事实数据表包含描述业务(如银行事务或产品销售)内特定事件的数据。维度表数据仓库中的表,其条目描述事实数据表中的数据。维度表包含创建维度所基于的数据。举个实际的例子。银行对存款记账,A表中存放实际数据,包括账号、所属机构号、存款金额等,B表存放机构号和机构名称的对应关系。则A是事实表,B是维表。其他说明:每个数据仓库都包含一个或者多原创 2022-05-01 14:52:59 · 1383 阅读 · 0 评论 -
数仓知识04:行转列、列转行的含义及SQL示例
在构建数仓或做数据分析时,需要对原始数据的结构进行一定的处理,有时涉及到“行转列”,有时涉及到“列转行”,那么这两个转换的方式具体是什么,有什么差异,今天给大家做一下讲解。原创 2022-05-01 14:28:49 · 2098 阅读 · 0 评论 -
数仓知识03:“自上而下“建设数仓和“自下而上“建设数仓的差异
想了解"自上而下"建设数仓和"自下而上"建设数仓的差异吗?看这篇文章就够了原创 2022-04-30 00:43:31 · 5338 阅读 · 0 评论 -
数仓知识02:星型模型、雪花模型、星座模型
一文让你了解星型模型、雪花模型、星座模型相关的知识。原创 2022-04-30 00:41:22 · 6410 阅读 · 0 评论 -
数仓知识01:数据库第一、二、三范式
一文让你了解数据库第一、二、三范式。原创 2022-04-30 00:35:22 · 4796 阅读 · 1 评论