hadoop2.7.3 win10部署

最新推荐文章于 2020-11-04 22:31:22 发布

peng4602

最新推荐文章于 2020-11-04 22:31:22 发布

阅读量322

点赞数

分类专栏： hadoop 文章标签：大数据 java

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/peng4602/article/details/84879307

版权

hadoop 专栏收录该内容

9 篇文章 0 订阅

订阅专栏

在win10下配置hadoop时 jdk的安装路径一定不能有空格。也就是不能安装在program files下

另外就是hadoop有些cmd命令不能用需要重新下载一个。下载好全部覆盖到bin文件即可。

下载地址：http://download.csdn.NET/detail/kokjuis/9706480

可参考http://blog.csdn.net/kokjuis/article/details/53537029 非常详细。

----------------

RAID：reduntant array of indenpendent disks ,独立磁盘冗余阵列。

普通磁盘的吞吐量100-150m/s

RAID-0由2个硬盘组成，可提供吞吐量，两个磁盘串联，数据打撒存储，缺点是一块算坏，另一块数据也无法读取。

RAID-1由2个硬盘组成，是实时镜像。两个硬盘记录相同的数据，缺点是磁盘浪费较多。

RAID-5 由3个硬盘组成，，同样是打撒存储，原始数据分别存储在一个硬盘，和另一个硬盘上，奇偶校验数据存储在剩余的一个硬盘上。每个数据的三部分在三个硬盘的存储是随机的，原始数据的一个硬盘算坏可以用奇偶校验数据和另一个硬盘数据进行恢复。

RAID-10由4个硬盘组成，先用RAID-1,在用RAID-0。

NameNode节点推荐使用RAID，DataNode不用需要，已经在不能节点上存储副本。

NameNode只对元数据的增删做日志记录，NameNode存放的都是路径。打开文件删除文件文件重命名，对于目录本上的操作都会被记录到日志中，对于数据的操作不做日志。DataNode故障时，负责创建更多的副本。

NameNode要维护两张表，第一个namespace（路径）--》block（硬盘存储）。第二个是维护block--》datanode（主机）不会存储在硬盘上（内存存储），每次nanenode还要从新重构block datanode的关系。datanode启动的时候会告知namdenode自身的情况。

namenode会周期想接收数据节点的情况（所有数据block），namenode负责副本的创建。

hadoop的副本存储是跨机架的，为了避免1在一个机架，2,3在另外以及机架，为了避免1停电，影响到2.

block是指hadoop文件存储的单位，v1是64m，v2是128m

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。