关于KUDU 的一些使用建议

最新推荐文章于 2024-05-28 15:35:46 发布

Apache_Jerry

最新推荐文章于 2024-05-28 15:35:46 发布

阅读量993

点赞数 1

分类专栏： Kudu 学习笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Apache_Jerry/article/details/103992848

版权

学习笔记同时被 2 个专栏收录

17 篇文章 0 订阅

订阅专栏

2 篇文章 0 订阅

订阅专栏

关于KUDU 的一些使用建议

1. Kudu 的分区字段选择：

正常的分区字段就是Kudu 表的主键字段进行范围分区或者hash分区，这里建议加上一个与业务时间有关的字段作为联合主键，这样可以缓解数据倾斜。

有人建议使用主键进行hash 分区，时间字段进行范围分区。

2. WAL 的存储目录：

官方建议，WAL最好是单独用闪存盘给Kudu 的WAL 搞一个存储目录。但是一般能给到SSD就算不错了，实在不行搞HHD也行，就是慢点嘛。

WAL 所在的磁盘最好是单独的，容量当然这个得根据你自己的集群来看，如果是HHD，磁盘容量又很大比如8T 4T 这样子，就不要让 WAL一个人用了，太浪费。

3. 关于Kudu 的存储磁盘是否要和Hdfs 的分开：

这个东西的，说法不一，磁盘都分开确实对两个组件好，能避免IO争用，但是带来的弊端就是维护麻烦，后期无论是哪个组件的磁盘满了，你想到时候在进行数据迁移就麻烦了。

Kudu 和Hdfs 的的存储磁盘放在一起的好处是什么呢,Hdfs 自己有一套数据平衡策略，即将DataNode 所占用的磁盘尽可能的平均化，这样依靠着这个平衡策略，磁盘空间能得到最大化的利用，单个磁盘容量不足的情况就会降低到最少。

4. 基本性能调优：

内存限制开到 24G以上；
维护管理器线程数设置为磁盘数的 1/3 或以上。

题外话：

Kudu 当一个副本丢失时，默认会采取 3-4-3 的复制策略，在特殊情况下也会采取 3-2-3 的复制策略。

kudu 的编码和压缩策略蛮好的

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
关于KUDU 的一些使用建议

关于KUDU 的一些使用建议1. Kudu 的分区字段选择：正常的分区字段就是Kudu 表的主键字段进行范围分区或者hash分区，这里建议加上一个与业务时间有关的字段作为联合主键，这样可以缓解数据倾斜。有人建议使用主键进行hash 分区，时间字段进行范围分区。2. WAL 的存储目录：官方建议，WAL最好是单独用闪存盘给Kudu 的WAL 搞一个存储目录。但是一般能给到SSD就算不错...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。