什么是数据倾斜？

最新推荐文章于 2024-05-04 20:13:16 发布

张紫娃

最新推荐文章于 2024-05-04 20:13:16 发布

阅读量393

点赞数 10

分类专栏：高可用性文章标签： java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_37646636/article/details/136788189

版权

高可用性专栏收录该内容

7 篇文章 0 订阅

订阅专栏

本文探讨了数据倾斜现象在分布式计算中的影响，如资源浪费、性能瓶颈和调度难题，通过实例展示了其在电商、日志分析、社交网络和金融交易中的表现。并介绍了几种解决方法，如数据拆分、二次分表和使用独立数据库等。

摘要由CSDN通过智能技术生成

数据倾斜是指在分布式计算中，由于数据分布不均匀导致某些节点处理的数据量远大于其他节点，从而使得整个计算过程的效率降低。

现实场景举例：

用户行为数据分析：
例如，某个电商平台上的VIP用户可能贡献了大部分的订单数据，使得处理VIP用户的节点负载远高于处理普通用户的节点。

日志分析：
例如，某个新闻网站上的热点新闻产生的访问日志量可能远大于其他新闻，使得处理热点新闻的日志节点负载过高。

社交网络分析：
例如，某个社交媒体平台上的明星用户可能拥有数百万的粉丝，处理这些用户的社交关系数据的节点负载远高于处理普通用户的节点。

金融交易数据分析：
例如，某个股票交易平台上，某些热门股票的交易量可能远大于其他股票，处理这些热门股票的交易数据的节点负载远高于处理其他股票的节点。

引发的问题

资源浪费：
由于大部分计算资源集中在处理大数据量的节点上，其他节点则处于相对空闲状态，导致整个集群的资源利用率低下。

性能瓶颈：
受数据倾斜影响的节点需要处理远超正常负载的工作量，这可能导致这些节点成为整个系统的性能瓶颈。任务在这些节点上的执行时间显著增加，进而拖慢整个分布式计算任务的完成速度。

调度难度增大：
在大规模分布式环境中，数据倾斜还会影响作业调度策略的有效性和效率，加大了集群管理与优化的难度。

如何解决？

拆分

二次分表

隔离

放在一个单独的数据库

[Ref] 什么是数据倾斜，会带来哪些问题？如何解决？

关注

10
点赞
踩
9

收藏

觉得还不错? 一键收藏
0
评论
什么是数据倾斜？

数据倾斜是指在分布式计算中，由于数据分布不均匀导致某些节点处理的数据量远大于其他节点，从而使得整个计算过程的效率降低。
复制链接

扫一扫

专栏目录

张紫娃 CSDN认证博客专家 CSDN认证企业博客

码龄7年

999: 原创

1万+: 周排名

2713: 总排名

83万+: 访问

: 等级

1万+: 积分

2587: 粉丝

3438: 获赞

136: 评论

3775: 收藏

私信

关注

热门文章

分类专栏

最新评论

【鸿蒙学习笔记】关系型数据库概述
dear风会停息: 照着你这个写完，报test，插入失败 Error: SQLite: Generic error.
【鸿蒙学习笔记】元服务
小王毕业啦: 博主的《【鸿蒙学习笔记】元服务-CSDN博客》让我对这个主题有了全新的认识。文章细致入微，每一个细节都被描绘得非常到位，让我感受到了博主的深厚功底。期待博主未来能够持续分享更多类似好文，同时也希望能够得到博主的指导，共同进步。非常感谢博主的分享和支持！
无法访问一些英文网站咋办?
m0_62358749: 7月4号起Suno.com(suno AI)突然不能登录了，国内登录前几个月都是完全正常的，不知道是国内这边什么机构把它屏蔽了还是对方拒绝国内用户使用了！请问这种情况怎么解决？关键问题我不久前才成为SUNO的付费用户，还在正常使用权期内
数据库汇总
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加除了各种控件外，文章正文的字数；(2)提升标题与正文的相关性。
HTTPS clone和SSH clone的区别
张紫娃: 不知道你要打开哪里？后面2段是git命令，伪代码记录思路用的，具体命令用法可参考https://blog.csdn.net/weixin_37646636/article/details/120404946

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。