前言:小白学习hadoop的第三天,刚开始写文档,服务器也不会玩,差点给我劝退了,2核4g的腾讯云被黑了去挖矿,cup跑的100%,当初还不知道,为啥执行map任务咋那么慢,就向大佬取取经,才去腾讯云登陆查看监控,结果发现被黑两天了,最后作为小白的我必然是一键重装系统,又重新初始化了集群。才开始今天hdfs的理论学习。最后想问问大佬有啥好的学习方法吗,理论知识真不想看,但是不看肯定不行的。
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/69ae0157d2167f6e1c78bdebbcf10cae.png)
HDFS
HDFS概述
1.掌握hdfs是什么
2.hdfs在hadoop集群处于什么位置
3.了解hdfs的优缺点
HDFS概念
- HDFS:Hadoop Distributed File System,是Hadoop项目的核心子项目,是分布式计算中数据存储管理的基础。
- 支持海量数据的存储,成百上千的计算机组成存储集群,HDFS可以运行在低成本的硬件之上,具有的高容错、高可靠性、高可扩展性、高吞吐率等特征,非常适合大规模数据集上的应用