分布式解决方案 google/yahoo

最新推荐文章于 2024-08-16 15:38:39 发布

AndrewWang79

最新推荐文章于 2024-08-16 15:38:39 发布

阅读量641

点赞数

分类专栏：设计文章标签：服务器 yahoo 分布式存储 google mapreduce hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/AndrewWang79/article/details/3858529

版权

设计专栏收录该内容

7 篇文章 0 订阅

订阅专栏

GOOGLE：

google号称内部好多服务使用这个解决方案，而且公布了好多相关设计文档。好人啊！

googlecluster ：集群

gfs ：分布式文件系统

chubby：锁服务

bigtable：分布式表

mapreduce：计算

YAHOO:

关于yahoo和hadoop渊源网上已经说的很详细啦。hadoop也提供了几乎和google一样的架构服务

hadoop

http://hadoop.apache.org

所有的演讲：

http://wiki.apache.org/hadoop/HadoopPresentations

最新的全面介绍：

http://wiki.apache.org/hadoop-data/attachments/HadoopPresentations/attachments/YahooHadoopIntro-apachecon-us-2008.pdf

总结：

两者的分布式存储和计算更多服务于网页，比如网页保存，索引计算

本想试着用纯粹的分布式文件系统，发现速度慢，而且。而且多个动态namespace机器间同步状态很麻烦，需要太多同步。这也是分布式和集中式的优缺点。

分布式文件系统和单机文件系统原理是一样的，都是通过一份namespace管理分散的data。

两者都采用一台独立服务器作为namespace服务器（多机热备）。data可以任意放在其中一台dataspace机器。都是采用无规则的name映射。个人觉得每次数据读取都需要通过namespace服务器，增加了负担。可以适当增加下数据和dataspace的规则，访问者可以不通过namespace直接访问dataspace。当然google/yahoo可能都是大文件，无所谓这点损失。但是如果小文件多的话，就需要快速访问啦。

规则方案：

建立“文件name的hash值的取余值”到“dataspace机器”的1:N映射表，这个映射表在namespace服务器和访问者都存在，而且是全部动态产生的，可以自调整。

建立这个映射表后，就要求同一个hash值的取余值必须放在同一台dataspace机器，多台dataspace机器可以存放同一个取余值。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
分布式解决方案 google/yahoo

GOOGLE：google号称内部好多服务使用这个解决方案，而且公布了好多相关设计文档。好人啊！googlecluster ：集群gfs ：分布式文件系统chubby：锁服务bigtable：分布式表mapreduce：计算 YAHOO:关于yahoo和hadoop渊源网上已经说的很详细啦。hadoop也提供了几乎和google一样的架构服务hadoop
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。