hadoop入门五步走

最新推荐文章于 2024-07-19 00:13:26 发布

haboop

最新推荐文章于 2024-07-19 00:13:26 发布

阅读量3.3k

点赞数

分类专栏：大数据书籍大数据经验大数据技术大数据资讯大数据应用大数据人生大数据教程文章标签：大数据数据分析程序员编程语言

本文链接：https://blog.csdn.net/haboop/article/details/89786319

版权

本文提供了一步一步的Hadoop入门指南，包括安装Hadoop集群、理解相关概念、操作HDFS、运行MapReduce示例以及本地开发。通过上传下载文件、运行wordcount例子和本地开发环境的配置，详细解释了Hadoop的工作机制。

摘要由CSDN通过智能技术生成

第一步安装hadoop集群

1、安装jdk，当前为jdk8，jdk9、10、11由于会移除一些类，导致hadoop集群安装失败安装细节不在赘述
2、hadoop的安装细节
注意的地方：Namenode和ResourceManger如果不是同一台机器，不能在NameNode上启动 yarn，应该在ResouceManager所在的机器上启动yarn。 第二步理解相关概念以及hadoop的模型

第三步操作操作 *1、直接在服务端操作使用hadoop命令做一些操作

给出一个文件上传到hdfs和下载到本地的example

# 1st  在本地新建一个文件
[root@node21 admin]# cat wc.txt 
a,1 b,1 b,5
a,3 c,3 d,15 e,11
a,2 d,2
# 2st 在hadoop上创建一个目录，用于存放该文件
[root@node21 admin] hadoop fs -mkdir -p  /user/input
可以看到hadoop的fs命令下，有很多和linux命令相似的地方,无聊可以help看哈
root@node21 admin]# hadoop fs --help
--help: Unknown command
Usage: hadoop fs [generic options]
    [-appendToFile <localsrc> ... <dst>]
    [-cat [-ignoreCrc] <src> ...]
    [-checksum <src> ...]
    [-chgrp [-R] GROUP PATH...]
    [-chmod [-R] <MODE[,MODE]... | OCTALMODE> PATH...]
    [-chown [-R] [OWNER][:[GROUP]] PATH...]
    [-copyFromLocal [-f] [-p] [-l] [-d] [-t <thread count>] <localsrc> ... <dst>]
    [-copyToLocal [-f] [-p] [-ignoreCrc] [-crc] <src> ... <localdst>]
    [-count [-q] [-h] [-v] [-t [<storage type>]] [-u] [-x] [-e] <path> ...]
    [-cp [-f] [-p | -p[topax]] [-d] <src> ... <dst>]
    [-createSnapshot <snapshotDir> [<snapshotName>]]
.................省略一堆堆
# 3st 上传到该目录
[root@node21 admin]hadoop fs -put ~/wc.txt  /user/input
# 4st 查看是否已经存在该文件
[root@node21 admin]# hadoop fs -ls /user/input
-rw-r--r--   2 admin supergroup         38 2019-03-30 08:41 /user/input/wc.txt
#5st  ok接下来下载到本地并查看
[root@node21 admin]# hadoop fs -get /user/input/wc.txt /home/
admin/  hadoop/ xzg/    
[root@node21 admin]# hadoop fs -get /user/input/wc.txt /home/
[root@node21 admin]# ls /home/
wc.txt  
### 就酱。