kudu性能优化

最新推荐文章于 2024-06-26 09:45:10 发布

longxibendi

最新推荐文章于 2024-06-26 09:45:10 发布

阅读量5k

点赞数 2

分类专栏： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/longxibendi/article/details/104964676

版权

一.背景

一个实时业务，数据流 app -> nginx ->lua ->kafka -> spark streaming ->kudu ->zepplin 。

打开zepplin，实时数据出不来。看不到。

二.问题分析-结合链路

1.近期流量暴涨，单个用户的使用时长，由1-1.5h 增加到 8-10h。

2.大量数据进入kakfa，得不到spark streaming及时处理，kafka有大量消息堆积。

3.streaming 任务，duration时间变长。

4.spark 的executor (执行算子) 写入kudu 延时变长。

5.kudu 中几乎快到了，拒绝写入数据(client写kudu 写入失败)的状态。

6.zepplin读kudu数据失败，延时特别长，导致打开zepplin看不到数据

三.问题分析-kudu数据库

1.问题聚焦到kudu数据库上，从数据库原理，特别是kudu处理请求的入手

[root@realtime-1 ~]# ps aux | grep 145440
root 68916 0.0 0.0 112708 964 pts/11 S+ 11:09 0:00 grep --color=auto 145440
kudu 145440 202 37.2 34052208 24452396 ? Sl Feb28 52555:59 /usr/lib/kudu/sbin/kudu-tserver --server_dump_info_path=/var/run/kudu/kudu-tserver-kudu.json --flagfile=/etc/kudu/conf/tserver.gflagfile

2.kudu用LSM 索引文件，组织数据，存储。写入过程先写内存，再刷磁盘。data+log 形式。WAL。

3.kudu 先把数据写内存(脏数据)，再写log(WAL)。随着内存中脏数据不断增加，kudu有一套机制会刷脏数据。

4.大量数据，写入kudu，kudu处理不及时，造

最低0.47元/天解锁文章

关注

2
点赞
踩
14

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

longxibendi CSDN认证博客专家 CSDN认证企业博客

码龄16年

144: 原创

3万+: 周排名

93万+: 总排名

214万+: 访问

: 等级

1万+: 积分

249: 粉丝

174: 获赞

107: 评论

554: 收藏

私信

关注

热门文章

分类专栏

go 4篇
c++ 14篇
Linux 87篇
MySQL 58篇
ORACLE 2篇
shell 20篇
发展历程 5篇
存储 5篇
安全、防火墙 2篇
年度总结 3篇
生活感悟 3篇
网络 6篇
负载均衡 14篇
高性能网站 47篇
自动化运维 5篇
NoSQL 12篇
Mongodb 14篇
Zabbix 2篇
测试 6篇
管理 7篇
Haproxy 2篇
Python 4篇
RabbitMQ 4篇
hadoop 3篇
机器学习 1篇
算法 1篇
Java 1篇

最新评论

nginx: [alert] version 1.4.0 of nginx.pm is required, but 1.2.0 was found
柠檬味的鱼°: 不用那么麻烦，直接从编译好的机器，cp过去也可以。 scp -P 22 -rp /usr/local/lib64/perl5/ root@192.168.100.10:/usr/local/lib64/perl5/
windows 安装gcc
TTianbo123: 博主的技术面很广哦，厉害👍可以加您微信随时交流吗？非常感谢
Linux批量更改文件后缀名
野柚子__: shell脚本这里应该是： find ./ -name '*.c' | while read i do echo "$i"; mv $i $i.txt done
etcd：从应用场景到实现原理的全方位解读
梦楼73: 我之前看了一篇ETCD的文章，里面非常详细讲解了Raft原理，以及ETCD的安装和使用，非常经典，希望可以一起学习交流~~ 《肝了一个月的ETCD，从Raft原理到实践》：https://mp.weixin.qq.com/s/BQSMuTSAYK3pmuR3BD5kvw
5种常用的相关分析方法
Lonely绿豆蛙: 你好，能找到的链接图都挂了，楼主有办法吗？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。