hadoop学习

virusos

已于 2022-08-11 15:59:35 修改

阅读量285

点赞数

分类专栏： hadoop 文章标签： hadoop 学习大数据

于 2022-08-08 10:38:14 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/virusos/article/details/126175160

版权

hadoop 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

hadoop是什么？

一个大数据处理框架，分布式计算平台

Hadoop最核心的设计是什么？

HDFS（Hadoop DFS，分布式文件系统）：提供了海量数据的存储
mapReduce（分布式计算框架）：提供了对数据的计算

再详细点：

HDFS是Hadoop分布式文件系统,具有高容错性、高伸缩性,允许用户基于廉价硬件部署,构建分布式存储系统,为分布式计算存储提供了底层支持
MapReduce提供简单的API,允许用户在不了解底层细节的情况下,开发分布式并行程序,利用大规模集群资源,解决传统单机无法解决的大数据处理问题

名词解释

Hive：一个分布式、按列存储的数据仓库
spark：也是一个大数据框架（重点用于计算），拥有Hadoop MapReduce所具有的优点，Spark在Job中间输出结果可以保存在内存中，从而不再需要读写HDFS，因此Spark性能以及运算速度高于MapReduce。

spark和hadoop的关系

我的理解是spark可以代替hadoop中的mapreduce，进行更快的计算。

spark为什么比mapReduce快？

https://zhuanlan.zhihu.com/p/70455833

spark与hadoop的联系

Hadoop提供分布式数据存储功能HDFS，还提供了用于数据处理的MapReduce。 MapReduce是可以不依靠spark数据的处理的。当然spark也可以不依靠HDFS进行运作，它可以依靠其它的分布式文件系统。但是两者完全可以结合在一起，hadoop提供分布式集群和分布式文件系统，spark可以依附在hadoop的HDFS代替MapReduce弥补MapReduce计算能力不足的问题。
spark在hadoop肩膀上可以让大数据跑的更快

MapReduce是什么？

一种编程模型，安装hadoop之后可以在java中编写map和reduce思想的程序。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop学习

一个大数据处理框架，分布式计算平台。
复制链接

扫一扫

专栏目录

virusos CSDN认证博客专家 CSDN认证企业博客

码龄8年

131: 原创

8万+: 周排名

2万+: 总排名

22万+: 访问

: 等级

2687: 积分

14: 粉丝

81: 获赞

26: 评论

157: 收藏

私信

关注

热门文章

分类专栏

一些准备 7篇
hadoop 1篇
git 2篇
docker 1篇
kubernetes 6篇
Tornado 1篇
力扣 15篇
随便记一下 13篇
python 22篇
习题 10篇
matlab 1篇
汇编 1篇
计算机组成原理 2篇
实验报告 2篇
数据库 4篇
android 5篇
java 16篇
前端学习 10篇
javascript 9篇
css 1篇
jquery 3篇
bootstrap 1篇
ajax 1篇
hibernate 1篇
linux 2篇
shell 2篇
网络 4篇
c++ 3篇
操作系统 2篇

最新评论

pip install 常用参数
virusos: 欧，看到咧
vue学习入门
技术小白白~: 您现在也在研究vue啊，这篇文章很实用，适合基础学习，收获满满~平时可以多多交流啊，大佬可以给个WX吗？
pip install 常用参数
Adenialzz: 写了呀，-v verbose，输出更多信息
cmd如何查找目录和文件
virusos: change directory?
Python-sorted与sort，以及模拟内置函数sorted()
一般努力的猪: 空列表的布尔值是False，非空列表的布尔值是Ture，这里循环剔除temp中的最小值，当temp为非空列表时，循环持续进行，当剔除掉最后一个时，temp为空列表，循环条件为False，终止循环。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。