hadoop_WordCountMap

最新推荐文章于 2023-05-05 17:49:26 发布

lhy857

最新推荐文章于 2023-05-05 17:49:26 发布

阅读量1.1k

点赞数

文章标签： hadoop

本文链接：https://blog.csdn.net/lhy857/article/details/124521261

版权

import org.apache.hadoop.io.IntWritable;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import java.io.IOException;
/*LongWritable 偏移量 Long，表示该行在文件中的位置，而不是行号
* Text map阶段的输入数据 一行文本信息 字符串类型 String
* Text map阶段的数据字符串类型String
* IntWritable map阶段输出的value类型，对应java中的int型，表示行号*/
public class WordCountMap extends Mapper<LongWritable,Text,Text,IntWritable>{               //空格占两个字符
    @Override
    protected void map(LongWritable key,Text value,Context context)throws IOException,InterruptedException{
        //读取每行文本
        String line=value.toString();
        //splite拆分每行
        String[] words=line.split(" ");//分词
        //取出每个单词
        for(String word:words){
            //将单词转为Text类型
            Text wordText=new Text(word);
            //将1转变为IntWritable
            IntWritable outValue=new IntWritable(1);
            //写出单词，跟对应1

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

lhy857

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
hadoop_WordCountMap

import org.apache.hadoop.io.IntWritable;import org.apache.hadoop.io.LongWritable;import org.apache.hadoop.io.Text;import org.apache.hadoop.mapreduce.Mapper;import java.io.IOException;/*LongWritable 偏移量 Long，表示该行在文件中的位置，而不是行号* Text map阶段的输入数据一行文本信息 .
复制链接

扫一扫