一、Hadoop的两个核心组成:
1、HDFS:分布式文件系统,存储海量的数据。
特点:数据冗余,硬件容错。
流式的数据访问。 一次写入,多次读取,顺序读写。不支持多用户并发写相同文件
存储大文件
2、MapReduce:并行处理框架,实现任务分解和调度。
二、[翻译]Secondary NameNode:它究竟有什么作用?
https://www.jianshu.com/p/5d292a9a8c86
三.命令
hadoop存放文件命令 hadoop fs -put hadoop-env.sh /input input为目录 将hadoop-env.sh放到input目录下
hadoop获取文件命令 hadoop fs -get
hadoop删除文件命令 hadoop fs -rm
hadoop创建目录命令 hadoop fs -mkdir
hadoop 格式化操作 : hadoop namenode -format
查看存储信息 hadoop dfsadmin -report
四.HDFS读写数据的过程