Hadoop

最新推荐文章于 2024-01-04 13:43:52 发布

残寂iي

最新推荐文章于 2024-01-04 13:43:52 发布

阅读量233

点赞数

文章标签： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_68066934/article/details/124534704

版权

本文介绍了Hadoop MapReduce的基本使用，通过一个WordCount实例展示了如何实现文本分词并计数。Map阶段利用Mapper类处理输入数据，将文本行拆分为单词，并输出<单词, 1>键值对。Hadoop系统中，包括HDFS分布式文件系统、NameNode、SecondaryNameNode、DataNode、YARN资源调度器等组件协同工作，确保数据处理的高效运行。" 111959362,10540312,bwlabel算法实现：一次遍历的二值化连通域标记,"['图像处理', '算法', 'C语言编程']

摘要由CSDN通过智能技术生成

import org.apache.hadoop.io.IntWritable;

import org.apache.hadoop.io.LongWritable;

import org.apache.hadoop.io.Text;

import org.apache.hadoop.mapreduce.Mapper;

import java.io.IOException;

/*LongWritable 偏移量 Long，表示该行在文件中的位置，而不是行号

* Text map阶段的输入数据一行文本信息字符串类型 String

* Text map阶段的数据字符串类型String

* IntWritable map阶段输出的value类型，对应java中的int型，表示行号*/

public class WordCountMap extends Mapper<LongWritable,Text,Text,IntWritable>{ //空格占两个字符

@Override

protected void map(LongWritable key,Text value,Context context)throws IOException,InterruptedException{

//读取每行文本

String line=value.toString();

//splite拆分每行

String[] words=line.split(" ");//分词

//取出每个单词

for(String word:words){

//将单词转为Text类型

Text wordText

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

残寂iي CSDN认证博客专家 CSDN认证企业博客

码龄3年

21: 原创

102万+: 周排名

190万+: 总排名

9443: 访问

: 等级

210: 积分

0: 粉丝

0: 获赞

0: 评论

2: 收藏

私信

关注

热门文章

分类专栏

笔记 7篇

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。