hadoop03——hadoop架构以及优缺点,常用的hadoop shell命令以及Eclipse hadoop API配置

本文深入探讨了Hadoop的HDFS设计思想、架构,以及其优缺点。详细介绍了如何使用Hadoop的Shell命令行,并提供了Eclipse中配置Hadoop API的步骤,包括环境变量设置、插件安装和库管理方法。
摘要由CSDN通过智能技术生成

hdfs的设计思想

1)分块存储
默认128M   hadoop2 
太大   负载不均衡
太小    namenode的压力过大
注意: 一个块 不够128M   单独成一个块
200M  

2)冗余存储
默认每一个块  3个副本  每一个块  总共存储3份
副本: 相同地位  互为副本  没有优先级
注意:	
	1)同一个块的不同副本  存储在不同节点的 
	2)默认副本3个   有一个宕机了   复制出来一个
	3)默认副本3   宕机  启动   副本4个   删除
	4)默认副本3    2个节点   存储2个  剩下一个记账

hdfs的架构 :

总:一主多从
主:
	namenode :
		1)存储元数据信息
		元数据:描述数据的数据   描述的datanode存储的数据的数据
		类似于  目录
			1)抽象目录树
			2)数据和块的对应关系
			3)块的存储位置
			
			目录:自己配置的  hdfs-site 
		2)接受客户端的读写请求
从:
	datanode :
		1)真正的存储数据
			按照块进行存储的  每一个数据块  id
			/home/hadoop/data/hadoopdata/data/current/BP-1453129122-192.168.191.201-1556592207649/current/finalized/subdir0/subdir0
		2)真正的处理客户端的读写请求的
助理:
	secondarynamenode:
		1)备份namenode的元数据信息的
		2)帮助namenode减轻压力的

hdfs的优缺点:

缺点:
	1)延迟性高  离线  磁盘落地
	2)不适合大量小文件存储
		1)namenode压力过大
		2)寻址时间过长
	3)不支持文件修改   支持追加   
优点:
	批量 
	离线 
	流式访问

hdfs的使用

shell

==========================
命令行
在hadoop集群中的任意一个节点都可以启动命令行
hadoop fs
hadoop 启动hadoop的客户端 连接hadoop集群
fs 打开hadoop的(文件系统)filesystem的客户端

命令集合:
-真正的执行命令
[-appendToFile … ]
[-cat [-ignoreCrc] …]
[-checksum …]
[-chgrp [-R] GROUP PATH…]
[-chmod [-R] <MODE[,MODE]… | OCTALMODE> PATH…]
[-chown [-R] [OWNER][:[GROUP]] PA

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值