(2)Hadoop

最新推荐文章于 2022-10-27 13:47:28 发布

cf_wu95

最新推荐文章于 2022-10-27 13:47:28 发布

阅读量153

点赞数

分类专栏：大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/cf_wu95/article/details/81088186

版权

大数据专栏收录该内容

11 篇文章 1 订阅

订阅专栏

Hive：可以写SQL语句,充当数据仓库作用，完成批量数据处理。

Pig：针对流式数据，轻量级脚本语言。

Tez:将整个MapReduce作业构建成一个有向无环图，实现作业的优化。

ZooKeeper：分布式协调一致性。分布式锁一致性，集群管理等等。

FLume:针对流式数据的收集工作，日志收集工具。

Spark类似于MapReduce，但是Spark是基于内存计算的。

Sqoop:将传统的关系型数据库的数据导入/导出到Hadoop（HDFS，Hbase，Hive中）。

HBase: 非关系型分布式数据库，架构在HDFS之上。用来存储非结构化和半结构化的松散数据。HDFS顺序读写，Hbase支持随机读写以及实时应用。

MapReduce:Data Processing

Yarn:集群的资源管理，cluster resource management

SecondaryNameNode在小型集群中可以和NameNode共用一台机器，较大的群集可以采用与NameNode相同的硬件。（不同的机器）

对于一个小的集群，名称节点（NameNode）和JobTracker运行在单个节点上，通常是可以接受的。但是，随着集群和存储在HDFS中的文件数量的增加，名称节点需要更多的主存，这时，名称节点和JobTracker就需要运行在不同的节点上。

安装：

1.一般选择下载最新的稳定版本，即下载 “stable” 下的 hadoop-2.x.y.tar.gz 这个格式的文件，这是编译好的，另一个包含 src 的则是 Hadoop 源代码，需要进行编译才可使用。

2.我们使用的是 hadoop 用户，并且已创建相应的用户目录 /user/hadoop （与系统用户名相对应），因此在命令中就可以使用相对路径如 input，其对应的绝对路径就是 /user/hadoop/input。标注：这里两个hadoop对应的。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
(2)Hadoop

Hive：可以写SQL语句,充当数据仓库作用，完成批量数据处理。Pig：针对流式数据，轻量级脚本语言。Tez:将整个MapReduce作业构建成一个有向无环图，实现作业的优化。ZooKeeper：分布式协调一致性。分布式锁一致性，集群管理等等。FLume:针对流式数据的收集工作，日志收集工具。Spark类似于MapReduce，但是Spark是基于内存计算的。Sqoop:将...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。