Hadoop生态圈介绍

最新推荐文章于 2024-03-07 17:34:49 发布

墨染百城

最新推荐文章于 2024-03-07 17:34:49 发布

阅读量2.2k

点赞数

分类专栏：大数据框架 Hadoop 文章标签： hadoop 简介

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/mrbcy/article/details/55205462

版权

大数据框架同时被 2 个专栏收录

31 篇文章 0 订阅

订阅专栏

29 篇文章 0 订阅

订阅专栏

Hadoop是一个分布式框架，底层的rpc也是用的netty。Spark2.0以后也用netty做rpc。

推荐Scala的书：《快学Scala》、《Scala编程指南》

什么是Hadoop

Hadoop是一套开源的平台
中间件
Hadoop是服务器集群，在集群上执行我们的代码
广义上来说，Hadoop是指一个更广泛的概念——Hadoop生态圈

Hadoop的核心组件

HDFS

分布式文件系统。有效利用各节点的存储空间，冗余备份。

YARN

运算资源调度系统。不同用户的不同业务程序运行的调度，调配硬件资源。尽可能服务更多的程序。各节点分为resource manager和node manager角色。YARN也是个集群

Map-Reduce

分布式运算编程框架。task程序需要符合Map-Reduce编程要求的模板代码。分为Map阶段和Reduce阶段。同时还需要一个Driver负责程序的运行启动。

Hadoop生态圈各组件简介

Hive

把数据组织成表的形式，然后大部分的Map-Reduce任务都可以用SQL语句来实现了。Hive可以将HDFS上的数据组织成表的形式，并把SQL语句转换成Map-Reduce Task进行执行，最后给出结果。大大降低了使用Hadoop进行数据分析的门槛。

HBase

这个稍后补充

ZooKeeper

协调各节点之间的状态

Mahout

机器学习和数据挖掘。大大加快了机器学习和数据挖掘的速度。

让很多高大上的技术走向千家万户

Flume

数据采集。把各种服务器上的日志实时的拷贝到Hadoop集群中。

Sqoop

负责RDBMS和HDFS之间的数据导入导出。

Hadoop的应用

应用于数据服务基础平台建设
用户画像
网站点击流日志数据挖掘

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hadoop生态圈介绍

Hadoop是一个分布式框架，底层的rpc也是用的netty。Spark2.0以后也用netty做rpc。推荐Scala的书：《快学Scala》、《Scala编程指南》什么是HadoopHadoop是一套开源的平台中间件Hadoop是服务器集群，在集群上执行我们的代码广义上来说，Hadoop是指一个更广泛的概念——Hadoop生态圈Hadoop的核心组件HDFS分布式文件系统。有效利用各节
复制链接

扫一扫

专栏目录

墨染百城 CSDN认证博客专家 CSDN认证企业博客

码龄7年

187: 原创

9万+: 周排名

57万+: 总排名

48万+: 访问

: 等级

5262: 积分

252: 粉丝

219: 获赞

151: 评论

855: 收藏

私信

关注

热门文章

分类专栏

Mproxy项目实录 7篇
Java并发编程 2篇
Linux基础 5篇
运维 6篇
大数据框架 31篇
Java基础 28篇
自定义rpc框架 13篇
maven 1篇
TDD 5篇
书山有路 16篇
测试
软件测试的艺术 4篇
Hadoop 29篇
Ambari 1篇
Java并发编程 1篇
Python 15篇
Mproxy项目实录 7篇
爬虫 2篇
信息检索笔记 2篇
LeetCode 41篇
随笔 5篇
职场 4篇
Hive 11篇
算法 5篇
Scala 1篇
SQL练习 2篇
SQL学习 15篇
flume 1篇
管理软件 1篇

最新评论

【SQL练习】经典SQL练习题
大数据-: 19题跟21题有什么区别哇
【SQL练习】经典SQL练习题
weixin_43840217: 第42题，答案select *会报错，个人理解[code=sql] SELECT s1.sno, s1.cno, s1.degree FROM scores s1 INNER JOIN (SELECT s2.cno c, MAX(s2.degree) max FROM scores s2 GROUP BY s2.cno) s3 ON s1.cno=c and s1.degree=max; [/code]
【SQL练习】经典SQL练习题
weixin_43840217: 记录第33题，[code=sql] SELECT s1.* FROM scores s1 INNER JOIN (SELECT s2.cno cno , AVG(s2.degree) as avg FROM scores s2 GROUP BY s2.cno) s3 ON s1.cno=s3.cno and s1.degree<s3.avg; [/code]
【SQL练习】经典SQL练习题
weixin_43840217: 第28题，只找到了计算机系副教授“李诚”。根据题意，电子工程系的讲师“张旭”也应该被找到吧。[code=sql] SELECT t0.tname, t0.prof FROM teachers t0 WHERE t0.prof<>(SELECT DISTINCT t1.prof FROM teachers t1 INNER JOIN teachers t2 on t1.depart<>t2.depart where t1.prof=t2.prof); [/code]
【SQL练习】经典SQL练习题
Face_spider: 刚看到这个帖子,看评论都在说20题,好吧我也做出来了献丑了 select * from (select *,row_number() over(partition by cno order by degree desc) as rk from scores) t1 where rk != 1 and sno in (select sno from scores group by sno having count(cno) > 1);

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。