分布式系统原理（2）--数据分布方式

最新推荐文章于 2023-12-22 19:10:00 发布

小肥羊的慢慢科研路

最新推荐文章于 2023-12-22 19:10:00 发布

阅读量571

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/summer00072/article/details/80698998

版权

本文探讨了分布式系统中的数据分布方式，包括哈希分布、数据范围分布、数据量分布、一致性哈希以及副本与数据分布等策略。各种方法各有优缺点，如哈希分布简单但扩展性有限，一致性哈希能较好地处理节点增减，而副本分布则影响系统的可扩展性和容错能力。选择合适的数据分布策略对于实现高效、稳定的分布式系统至关重要。

摘要由CSDN通过智能技术生成

二、分布式系统原理

1、数据分布方式

如何将分布式系统的输入数据拆解为可疑使用多机分布式处理的过程，成为数据分布方式。

（1）哈希方式（最常见）

按照数据的某一特征计算哈希值，并将哈希值与机器建立映射关系，从而将不同的数据分布到不同的机器上。如按数据属于的用户id计算哈希值，集群中的服务器按0-机器数减一编号，哈希值除以服务器的个数，余数为处理该数据的服务器编号。

l 优点：只要哈希函数的散列特性好，哈希方式可以较为均匀的将数据分布到集群中去，要记录的元信息也很简单，任何时候，任何节点只要知道哈希函数的计算方式及模的服务器总数就可以计算出处理具体数据的机器是哪台。

l 缺点：

l 可扩展性不高，一旦集群规模需要扩展，则几乎所有的数据需要被迁移并重新分布。工程上会成倍扩展，这样原本一台机器上的数据只需迁移一半到另一机器上。

改进：使用专门的元数据服务器管理对应关系，让哈希值取模个数大于机器个数，同一机器需负责多个哈希取模的余数，使得扩容不依赖于机器数的成倍增长。问题：需较复杂的机制维护大量的元数据

l 一旦数据特征值严重不均，容易出现“数据倾斜”（data skew）问题。

（2）按数据范围分布

将数据按特征值的值域范围划分不同的区间，使得集群中每台（组）服务器处理不同区间的数据。为数据迁移等负载均衡操作的方便，往往利用动态划分区间的方式，使得每个区间中服务的数据量尽量的一样多。若某区间数据量较大，则可将区间“分裂”拆成两个区间。

l 优点：可以

最低0.47元/天解锁文章

小肥羊的慢慢科研路

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分布式系统原理（2）--数据分布方式

二、分布式系统原理1、数据分布方式如何将分布式系统的输入数据拆解为可疑使用多机分布式处理的过程，成为数据分布方式。（1）哈希方式（最常见）按照数据的某一特征计算哈希值，并将哈希值与机器建立映射关系，从而将不同的数据分布到不同的机器上。如按数据属于的用户id计算哈希值，集群中的服务器按0-机器数减一编号，哈希值除以服务器的个数，余数为处理该数据的服务器编号。l 优点：只要哈希函数的散列特性好，哈希...
复制链接

扫一扫

小肥羊的慢慢科研路 CSDN认证博客专家 CSDN认证企业博客

码龄8年

137: 原创

18万+: 周排名

84万+: 总排名

49万+: 访问

: 等级

5072: 积分

82: 粉丝

315: 获赞

31: 评论

1073: 收藏

私信

关注

热门文章

最新评论

typedef和define有什么区别
5wing_Sang: 简单明了赞
typedef和define有什么区别
一如既往_: 确定常量指针还是指针常量的时候，把变量类型去了，const INTPTR2 p2 -> const p2，p2 指向的地址不能变
typedef和define有什么区别
HeroFUCKEVERYTHING: 我就喜欢你这种较真的劲，中国未来的希望。
typedef和define有什么区别
Torch_HXM: typedef不是define，typedef是类型重命名不是简单的替换。，你自己写一段程序验证一下就好了。最后哥劝你一句，搞学问要心平气和。
typedef和define有什么区别
她似白月水中花: 好好去了解下预编译阶段的宏替换，去好好看看这篇文章的作者在文章最后写p1和p2指针这部分的解释，请问const int* p1, const int * p2,这两个是同一个数据类型还是不是?你把他的宏定义替换进去看看呢？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。