数仓
文章平均质量分 93
enjoy编程
Stay hungry, stay foolish.(求知若饥,虚心若愚。)
15年+ Java 全栈与大数据架构老兵,兼具技术深度与业务视野
喜欢使用java、python解决工作、生活中的问题
展开
专栏收录文章
- 默认排序
- 最新发布
- 最早发布
- 最多阅读
- 最少阅读
-
数据湖Data Lakehouse支持行级更改的策略:COW、MOR、Delete+Insert
COW:写时复制,MOR:读时合并,Delete+Insert:保证同一个主键下仅存在一条记录,将更新操作转换为Delete操作和Insert操作COW和MOR的对比如下图,而Delete+Insert在StarRocks主键模型中用到。目前COW、MOR在三大开源数据湖项目的使用情况详见下文原创 2023-04-29 11:49:01 · 1399 阅读 · 0 评论 -
数据仓库系列:StarRocks的简单试用及与clickhouse的对比
本文记录针对StarRocks的试用情况,并拿StarRocks与ClickHouse进行了对比。StarRocks 与 ClickHouse 是两款基于 MPP 架构的列式数据库管理系统,都可以提供高性能的 OLAP 分析能力。 但是它们在功能、性能和使用场景上也有一些区别想知道这些区别嘛,快来看看这篇文章吧原创 2023-04-09 20:11:48 · 4461 阅读 · 0 评论 -
数据仓库系列:StarRocks 下一代高性能分析数据仓库的架构、数据存储及表设计
本文是学习StarRocks的读书笔记,让你快速理解下一代高性能分析数据仓库的架构、数据存储及表设计。原创 2023-04-09 09:17:22 · 3758 阅读 · 0 评论 -
数仓中的维度、原子指标、派生指标、衍生指标、指标分类、缓慢变化维等的含义
1 基本概念1.1 实体从业务角度讲,实体是为了满足分析的需要,抽象出来的概念,从业务中拆分出一个个实体,可以是现实存在的业务对象,如用户,商家,商品,也可以是现实没有的,如虚拟的业务对象,活动,会员等等1.2 维度维度是度量的基础,用来反映业务的一类属性,这类属性的集合构成一个维度,也可以称为一个实体对象。在划分数据域、构建总线矩阵时,需要结合对业务过程的分析定义维度。1.3 业务过程业务过程是指企业的业务活动事件,如下单、支付、退款都是业务过程。通常业务过程是企业活动中的事件,因此业务过程原创 2021-07-19 11:30:33 · 13308 阅读 · 1 评论 -
关于未来数据开发技术方向的观点
未来数据开发技术方向,我认为有三个,首先是流批一体成为主流开发模式,其次是代码自动化技术走向成熟,第三是 OLAP Cubes 终将衰落。一、流批一体成为主流开发模式 先说说我看到的数据开发的历史。 “远古”时代,通过写 SQL 脚本抽取 OLTP 数据库中数据进行分析和统计,大量查询有可能把数据库拖挂; OLAP 分析成为数据库的一项重要能力,这个时候,可以写 SQL,也可以写Python 代码等来进行数据分析和统计,但面对不断增长的数据量,数据库性能遇到挑战; H..转载 2021-01-12 14:24:52 · 526 阅读 · 0 评论
分享