大数据hdfs
广义: 指的是Hadoop的生态圈,有很多的大数据组件构建而成,包括:Linux,zookeeper,Hadoop,hive,hbase,redis,elk,kafka,java,scala,python,impala,kudu,spark,flink。狭义: 指的就是Hadoop这个组件里面的3个组件,MapReduce,hdfs,yarn。resourcemanager: 接收客户端的任务,分配任务,管理资源。2.x: 更加稳定,因为MapReduce的压力减轻了。数据存储问题,还会自动备份。
原创
2024-01-21 22:39:35 ·
356 阅读 ·
0 评论