![](https://img-blog.csdnimg.cn/20201014180756918.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hadoop
文章平均质量分 97
妍妍的宝贝
好的好的
展开
-
hadoop词频统计
此文章基于搭建好hadoop之后做的词频统计实验,以上是链接。原创 2024-06-30 17:10:23 · 1429 阅读 · 0 评论 -
Hadoop 安装与伪分布的搭建
在Hadoop生态系统中,YARN(Yet Another Resource Negotiator)是一个通用的资源管理系统,它不仅可以管理MapReduce作业,还可以支持其他类型的计算框架。Secondary NameNode并不存储集群的实时状态,但它定期合并NameNode的fsimage和editlogs文件,减少NameNode的启动时间。在生产环境中,这通常是不推荐的做法,因为如果存储数据的节点出现故障,数据可能会丢失。DataNodes存储实际的数据块,是HDFS数据存储的主要组成部分。原创 2024-06-29 16:33:13 · 996 阅读 · 0 评论