大数据,这些你了解了么?

最新推荐文章于 2023-12-30 11:39:14 发布

不觉-

最新推荐文章于 2023-12-30 11:39:14 发布

阅读量235

点赞数 1

分类专栏：大数据文章标签： Hadoop Hadoop起源大数据分布式框架

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/tp15868352616/article/details/80629406

版权

大数据专栏收录该内容

9 篇文章 1 订阅

订阅专栏

一.Hadoop的起源

谈到大数据，就不得不提Google的三驾马车：Google FS、MapReduce、BigTable。虽然Google没有公布这三个产品的源码，但是他发布了这三个产品的详细设计论文，奠定了风靡全球的大数据算法的基础！

Google FS---------> HDFS

MapReduce-------> MapReduce

BigTable------------> HBase

将任务分解然后在多台处理能力较弱的计算节点中同时处理，然后将结果合并从而完成大数据处理。

二.分布式:

相对于集中式
集中式特点：
一台机器，所有东西（软件）都放在此计算机上（安装）
分布式特点：
多台机器：将东西(硬件)进行划分，每台机器存储一部分
元数据：记录数据分配给那一个从节点的数据
架构：
主节点Master 老大，管理者
管理
从节点Slave 从属，奴隶，被管理者

干活

三.大数据框架按照功能来划分

海量数据存储：
HDFS、Hive（本质存储数据还是hdfs）、HBASE、ES
海量数据分析：

MapReduce、Spark、SQL

四.最原始的Hadoop框架

数据存储：HDFS（Hadoop Distributed File System）
数据分析：MapReduce

五.Hadoop介绍

大数据绝大多数框架，都属于Apache顶级项目

Apache官网:

http://apache.org/

hadoop官网：

http://hadoop.apache.org/

六.Hadoop模块

Hadoop也是分布式架构

HDFS:
主节点：NameNode
决定着数据存储到那个DataNode上
从节点：DataNode
存储数据

MapReduce:

分而治之思想

将海量的数据划分为多个部分，每部分数据进行单独的处理，最后将所有结

果进行合并

map task
单独处理每一部分的数据、

reduce task
合并map task的输出

YARN:

分布式集群资源管理框架，管理者集群的资源（Memory,cpu core）

合理调度分配给各个程序（MapReduce）使用

主节点：resourceManager

掌管集群中的资源

从节点：nodeManager
管理每台集群资源

作者:唐平部分信息来自于互联网

时间:2018-06-09

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

不觉- CSDN认证博客专家 CSDN认证企业博客

码龄8年

41: 原创

74万+: 周排名

95万+: 总排名

28万+: 访问

: 等级

1973: 积分

57: 粉丝

148: 获赞

33: 评论

267: 收藏

私信

关注

分类专栏

心得
编程思想 1篇
程序设计基础 8篇
面向对象 2篇
Linux 8篇
Linux服务器 2篇
shell 1篇
Maven 3篇
java 2篇
大数据 9篇
协作开发 1篇
hive 3篇
scala 5篇
Hbase 1篇
kettle 1篇

最新评论

事实表和维度表的定义
会飞的土羊: 为什么不用张大横表呢？
程序的跳出,与跳过,和函数的打破
溪道即名陈: break 是跳出一个大括号，总结的好
事实表和维度表的定义
不觉-: 谢谢,你推荐的文章我也看了,对我也有所帮助,能帮到你我也算没白写哈哈哈哈
switch 多分支语句,及其流程图,和if的对比和运行机制
萌新小白向前冲回复 CodeBull。: 现在支持了吧
事实表和维度表的定义
AWPvsAK47: 专门登录来点个赞，清晰易懂，比很多文章写几千字要好理解。我是结合 https://blog.csdn.net/Athenaer/article/details/7885726 来更深了解的

最新文章

目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。