hadoop生态圈

最新推荐文章于 2022-07-27 13:59:38 发布

ant_yi

最新推荐文章于 2022-07-27 13:59:38 发布

阅读量1.3k

点赞数

分类专栏： hadoop学习大数据学习文章标签： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_42490528/article/details/84642158

版权

大数据学习同时被 2 个专栏收录

53 篇文章 2 订阅

订阅专栏

13 篇文章 1 订阅

订阅专栏

hdfs：存文件的，分布式文件存储系统

map-reduce: 有map和reduce两个阶段，适用于分布式的并行计算。

yarn：资源调度的，资源管理器，新的map-reduce版本

详细介绍：https://www.cnblogs.com/yjd_hycf_space/p/6735290.html

hbase：就是一种数据库，面向列的非关系型数据库

hbase是一种面向列的非关系型数据库，hbase是基于hdfs上的，数据最终存在hdfs文件系统上

访问网址：（master：端口）192.168.80.139:50070

hbase的namespace：namespace 名称空间，在逻辑上对表进行分组

hbase shell：常用命令：https://www.cnblogs.com/ityouknow/p/7344001.html

zookeeper： hbase依赖zookeeper，zk提供分布式集群的协同服务（如时间同步）

详细介绍：

https://www.cnblogs.com/felixzh/p/5869212.html

http://www.open-open.com/lib/view/open1415453633887.html

hbase与zookeeper：

hbase依赖于zookeeper，zookeeper可以使用内置的也可以外配

可以使用hbase zkcli进入zookeeper命令行

zkCli.sh -server hadoop01:2181

hive：是hbase的访问接口，类似hbase shell，hbase的访问接口有：

hive的产生：非java编程者对hdfs做mapreduce操作

hive是基于Hadoop的一个数据仓库工具，可以将结构化的数据文件映射为一张数据库表，并提供简单的sql查询功能，可以将sql语句转换为MapReduce任务进行运行。其优点是学习成本低，可以通过类SQL语句快速实现简单的MapReduce统计，不必开发专门的MapReduce应用，十分适合数据仓库的统计分析。

spark：类似hadoop，另一种mapreduce框架，

中间结果保存在内存中，所以快。适用于机器学习、数据挖掘等算法。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop生态圈

hdfs：存文件的，分布式文件存储系统 map-reduce: 有map和reduce两个阶段，适用于分布式的并行计算。 yarn：资源调度的，资源管理器，新的map-reduce版本详细介绍：https://www.cnblogs.com/yjd_hycf_space/p/6735290.html hbase：就是一种数据库，面向列的非关系型数据库hbase...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。