Doris最全使用手册

最新推荐文章于 2024-07-25 08:45:00 发布

斑马！

最新推荐文章于 2024-07-25 08:45:00 发布

阅读量1w

点赞数 3

分类专栏： # 数据库文章标签：数据库大数据数据仓库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/yezonghui/article/details/126906713

版权

这篇博客全面介绍了Doris，一个面向分析的MPP数据库，包括其定义、业务场景、关键特性。文章深入探讨了Doris与其他数据库的区别，详细讲解了其底层索引和读写流程，特别是数据的分区和分桶策略。此外，还涵盖了数据模型选择、上卷操作以及前缀、BloomFilter和Bitmap索引的应用。

摘要由CSDN通过智能技术生成

目录

一：doris基础介绍

1.1 doris介绍

1.1.2 具体的业务场景包括

1.1.3 Doris关键特性

二：Doris与其它数据库比较

三：底层索引与读写流程

3.1 Doris整体架构

3.2 Doris存储设计目标

四：数据划分（分区、分桶）

4.1 分区&分桶&表

4.2 分区分桶使用

4.3 partition和bucket的数量和数据量的建议

4.4 复合分区与单分区

五：数据模型特性与选择

6.1 基本概念

6.2 rollup使用说明

7.1 前缀索引

7.2 bloomfilter索引

7.3 bitmap索引

一：doris基础介绍

1.1 doris介绍

1.1.1 定义

doris是一个基于mmp(massively parallel processing,即大规模并行处理)的交互式sql数据仓库，是一个面向多种数据分析场景的、兼容mysql协议的、高性能的、分布式关系型列式数据库，用于报告和分析。

1.1.2 具体的业务场景包括

数据仓库建设
olap分析
用户行为分析
系统监控分析

1.1.3 Doris关键特性

支持mysql协议
按key排序
在线表结构变更
两层分区。分区：range partition; 分桶 hash bucket
mpp查询引擎：基于impala
列式存储：按列存储，高压缩比，多种索引
高基数精准去重
元数据全内存访问，快速访问
高度内聚，不依赖第三方系统

二：Doris与其它数据库比较

特征	Hadoop	MPPDB	传统数据库
扩展能力	高	中（通过Hash计算数据行的物理机器，存储位置不透明 ⚠️并行：数据通过Hash存储，但是任务没有，无论大小会在每个节点走一圈））	低
系统和系统管理成本	高	中（数据切分了，但是文件数没有变少，每个表在每个节点上一定有一到多个文件。同样节点数越多，存储的表就越多，导致每个文件系统上有上万甚至十万多个文件）	中
应用开发维护成本	高	中（只设置 FE(Frontend)、BE(Backend)两种角色、两个进程，不依赖于外部组件，方便部署和运维。)	中
SQL支持	中	高。在使用接口方面，Doris采用mysql协议，高度兼容mysql语法，支持标准sql。	高
数据规模	PB级别	准PB级别	TB级别
计算性能	对非关系型操作效率高	对关系型操作效率高	对关系型操作效率高
数据结构	结构化、半结构化和非结构化数据	结构化数据	结构化数据
特征总结	Hadoop在处理非结构化和半结构化数据上具备优势，尤其适合海量数据批处理等应用要求	MPP适合替代现有关系数据机构下的大数据处理，具有较高的效率。 Doris采用列式存储，按列进行数据的编码压缩和读取，能够实现极高的压缩比，同时减少大量非相关数据的扫描，从而更加有效利用io和cpu资源。	-
应用场景	Hadoop适合海量数据存储查询、批量数据ETL、非机构化数据分析(日志分析、文本分析)等。	适合多维度数据自助分析、数据集市等	-

三：底层索引与读写流程

3.1 Doris整体架构

Frontend（FE），主要负责用户请求的接入、查询解析规划、元数据的管理、节点管理相关工作。
Backend（BE），主要负责数据存储、查询计划的执行

3.2 Doris存储设计目标

支持大数据量的分布式数据管理
支持事务	两阶段提交数据多版本管理
对分析型友好	灵活的数据模型：aggregate、uniq、duplicate 高效的查询：列式存储、索引设计、预聚合rollupp

最低0.47元/天解锁文章

关注

3
点赞
踩
26

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。