HDFS的实现机制

最新推荐文章于 2022-03-21 08:13:23 发布

weixin_34021089

最新推荐文章于 2022-03-21 08:13:23 发布

阅读量98

点赞数

参考以上这张图，实际上我们客户端访问HDFS里面的内容时，并不需要真实知道内容存在于服务器的内容的真实路径，我们只需要知道一个虚拟路径就可以，比如最上面的hdfs://weekend110:9000/wordcount/input/test.txt，而HDFS内部已经将虚拟路径和真实路径的映射关系对应好了。

比如，现在我们想把一个512M的文件切成4块存储在HDFS中，假设HDFS有一个NAMENODE，三个DATANODE，那么DATANODE01存1，DATANODE02存2，DATANODE03存3，DATANODE03存4（假设这么存），并且为了防止一台机器宕机，在每一个DATANODE上面还会存储其他文件块的副本。但是这么一来，我们客户端通过虚拟路径去访问某一个文件，文件又被分得七零八落，HDFS内部怎么知道哪个DATANODE上面有哪些文件块呢？这就用到了NAMENODE，实际上它是一个对应关系的映射表，比如还是刚才那个虚拟路径hdfs://weekend110:9000/wordcount/input/test.txt，它对应的文件块会依次标注出来，在哪些DATANODE上面，并且大小是多少。

weixin_34021089

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
HDFS的实现机制

参考以上这张图，实际上我们客户端访问HDFS里面的内容时，并不需要真实知道内容存在于服务器的内容的真实路径，我们只需要知道一个虚拟路径就可以，比如最上面的hdfs://weekend110:9000/wordcount/input/test.txt，而HDFS内部已经将虚拟路径和真实路径的映射关系对应好了。比如，现在我们想把一个512M的文件切成4块存储在HDFS中，假设HDFS有一个NA...
复制链接

扫一扫

weixin_34021089 CSDN认证博客专家 CSDN认证企业博客

码龄9年

129: 原创

-: 周排名

172万+: 总排名

137万+: 访问

: 等级

7805: 积分

6763: 粉丝

243: 获赞

38: 评论

1438: 收藏

私信

关注

热门文章

最新评论

得到精品课《如何成为有效学习的高手》之学习笔记
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)提升标题与正文的相关性；(2)使用更多的站内链接。
深度学习的模型是怎么训练/优化出来的
普通网友: 作为深度学习从业者，我可以很明确的说，跑训练这个事情，必须得有一个好的显卡，别人10分钟能跑完的任务，你这里需要跑一个小时，在这个过程中别人已经调优了好几轮了，效率提不上去的话根本没办法和其他人竞争，哪怕是没有钱买好的卡，租一张也行呀，我就是找了几个平台，autodl，inscode和炼丹侠去租的A100，跑训练的时候比我本机快了将近10倍，而且调优之后启动也特别快，炼丹侠还有免费试用活动，我是觉得用租卡的钱换节省的时间很值
ajax跨域问题
humengsir: 拷贝我博客园博客不注明转载是吧?
移动端H5地图离线瓦片方案
小盆友爱洗澡: 请问一下大佬 vue打包的安卓app 可以使用这个方法吗地图文件是我们自己的切片
电脑自动关机导致文件丢失怎么办？
歐陽呀: 有免费的不

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。