- 博客(4)
- 收藏
- 关注
原创 12.4 三
让类【TopNMapper】继承类Mapper同时指定需要的参数类型,根据业务逻辑修改map类的内容如下: package com.simple.topn; import java.io.IOException; import java.util.Arrays; import org.apache.hadoop.io.IntWritable; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import
2020-12-04 22:03:43 144
原创 12.4 二
让类【DeduplicationMapper】继承类Mapper同时指定需要的参数类型,根据业务逻辑修改map类的内容如下。 package com.simple.duduplication; import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.Text; import org.apache.hadoop.mapreduce.Mapper; public class
2020-12-04 21:34:13 121
原创 2020-12-04
编写WordCountMapper类,完成对单词的切分处理,并以(k,v)的形式输出到Reduce阶段 让【WordCountMapper】继承类Mapper同时指定需要的参数类型,根据业务逻辑修改map类的内容如下: package com.simple; import java.io.IOException; import org.apache.hadoop.io.LongWritable; import org.apache.hadoop.io.NullWritable; import org.apa
2020-12-04 21:07:22 231
原创 HDFS API作业
//HDFS API作业 package com.hdfs; import java.io.IOException; import java.net.URI; import java.util.ArrayList; import java.util.List; import org.apache.hadoop.conf.Configuration; import org.apache.hadoop.fs.FSDataInputStream; import org.apache.hadoop.fs.FSDat
2020-12-02 13:29:44 168
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人