2024年最新大数据入门-三分钟读懂Hadoop(2)，2024年最新面试阿里

最新推荐文章于 2024-06-17 22:31:37 发布

2401_84166376

最新推荐文章于 2024-06-17 22:31:37 发布

阅读量240

点赞数 4

分类专栏：程序员文章标签：大数据面试学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2401_84166376/article/details/138847929

版权

程序员专栏收录该内容

184 篇文章 0 订阅

订阅专栏

既有适合小白学习的零基础资料，也有适合3年以上经验的小伙伴深入学习提升的进阶课程，涵盖了95%以上大数据知识点，真正体系化！

由于文件比较多，这里只是将部分目录截图出来，全套包含大厂面经、学习笔记、源码讲义、实战项目、大纲路线、讲解视频，并且后续会持续更新

需要这份系统化资料的朋友，可以戳这里获取

一、背景及概念

=======

**背景：**经过自己三年多的接触，个人谈一些自己的愚见。我们之所以用Hadoop，是因为关系型数据库已经不能满足我们对数据处理的要求。比如我们要进行数据的追溯以及关联，简单的关系型数据库经过优化以及处理没有办法满足我们对于数据的即时性要求。所以通过Hadoop，我们可以将数据放到Hive通过MR或者Impala去计算查询数据，这样我们的数据会跑的比较快一点。给业务带来诸多便利，帮助业务更好的发展。

**概念：**Hadoop是一个由Apache基金会所开发的分布式系统基础架构。用户可以在不了解分布式底层细节的情况下，开发分布式程序。充分利用集群的威力进行高速运算和存储。Hadoop的框架最核心的设计就是：HDFS和MapReduce。HDFS为海量的数据提供了存储，而MapReduce则为海量的数据提供了计算。

二、特点

====

**高可靠性：**Hadoop按位存储和处理数据的能力值得人们信赖。

**高扩展性：**Hadoop是在可用的计算机集簇间分配数据并完成计算任务的，这些集簇可以方便地扩展到数以千计的节点中。

高效性： Hadoop能够在节点之间动态地移动数据，并保证各个节点的动态平衡，因此处理速度非常快。

**高容错性：**Hadoop能够自动保存数据的多个副本，并且能够将失败的任务重新分配。

**低成本：**与一体机、商用数据仓库是开源的，项目成本大大降低。

三、架构

====

四、大白话

=====

个人理解的Hadoop

首先，是因为数据量大，数据种类多，我们传统的关系型数据库已经不能满足我们的需求。Hadoop能干啥，Hadoop是免费的，我们暂时没有很多资金的小伙伴可以使用它。

第二，Hadoop是可以扩展的，就是说我们一台机器不够用了，可以再加一台，流程不是很复杂，简单的写几条命令就可以了。

第三，Hadoop的机器是可以动态的移动数据，这就是啥呢，这就是互帮互助，在现实生活中，你负担大了，我可以帮助你，你可以帮助我。这种帮助机制是有自己的调度资源的。

第四，Hadoop是有容错机制的，什么意思呢。就是说你事情做错了，我们可以有办法给你矫正。当然是要备份之前的副本，可以给你还原回去了。保证你的数据是错误的，现实生活中错误是没有办法避免的，我们唯有每天自省，每天反思，才能避免少犯错误或者不犯错误。让自己弯道超车，让自己少走弯路。

五、其他

====

**下一篇：**介绍我们伟大的HDFS，走起。

**鸡汤：**认识谁都没有用，只有自己牛逼了才有用。人只有奋斗，才会快乐。

**备注：**以上资料来自网络，侵删。

网上学习资料一大堆，但如果学到的知识不成体系，遇到问题时只是浅尝辄止，不再深入研究，那么很难做到真正的技术提升。

需要这份系统化资料的朋友，可以戳这里获取

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

18545628)**

一个人可以走的很快，但一群人才能走的更远！不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人，都欢迎加入我们的的圈子（技术交流、学习资源、职场吐槽、大厂内推、面试辅导），让我们一起学习成长！

关注

4
点赞
踩
10

收藏

觉得还不错? 一键收藏
0
评论
2024年最新大数据入门-三分钟读懂Hadoop(2)，2024年最新面试阿里

保证你的数据是错误的，现实生活中错误是没有办法避免的，我们唯有每天自省，每天反思，才能避免少犯错误或者不犯错误。第三，Hadoop的机器是可以动态的移动数据，这就是啥呢，这就是互帮互助，在现实生活中，你负担大了，我可以帮助你，你可以帮助我。这种帮助机制是有自己的调度资源的。**高扩展性：**Hadoop是在可用的计算机集簇间分配数据并完成计算任务的，这些集簇可以方便地扩展到数以千计的节点中。第二，Hadoop是可以扩展的，就是说我们一台机器不够用了，可以再加一台，流程不是很复杂，简单的写几条命令就可以了。
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。