首先就是上题目
首先就是看一下源数据和处理后的数据发生了那些变化,这里我们发现,就是他们日期格式发生了变化
现在我们需要思考的问题就是怎么样才能让他的日期格式发生变化,首先需要明白的是,我们处理的是什么呢,是字符串类型的数据,虽然他的格式是json格式的,但是归根结底还是还是字符串String类型的数据,在String中是否有方法能够有让其发生变化呢。对String类熟悉的人都知道String类中有两个方法能够实现字符的替换,replace和replaceAll方法,不知道给我查api啊
replace方法和replaceAll方法都是替换指定的字符串
replace官方给出的解释是
用指定的文字替换序列替换与文字目标序列匹配的字符串的每个子字符串。
replaceAll官方给出的解释是
将与给定正则表达式匹配的字符串的每个子字符串替换为给定的替换
对于我们这个需求来说,其实这两个都没有问题,
替换的方法我们是找到了,但是这里你还得考虑一个问题。你这个数据终究是一个json格式的数据,而且你处理的也就一个数据,我们是不是得用用json中的getString来获得指定的字符串呢,当然使用这个的前提是我们处理的是一个数组数据
分析到这里基本的思路也就全部出来了,我们先将这个字符串转化为数组,然后使用json中的方法得到对应的数据,然后使用replace方法对其进行处理,然后再讲处理后的数据给放回去
根据思路可以得到接下来的map阶段的代码,当然我这里也是用方法对其封装了
import net.sf.json.JSONObject;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;
import java.io.IOException;
public class MapperfWeather extends Mapper<LongWritable, Text,Text, NullWritable> {
Text k=new Text ();
@Override
protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
String x = value.toString();
k=this.text1(x);
context.write(k,NullWritable.get());
}
//清晰实操3
public Text text1(String line){
JSONObject jsonObject=JSONObject.fromObject (line);
String [] words =new String[2];
words[0]=jsonObject.getString ("date");
words[1]=jsonObject.getString ("city");
words[0]=words[0].replace ("-","/");
// words[0]=words[0].replaceAll ("-","/");
//这里要用replaceall考虑
jsonObject.put ("date",words[0]);
jsonObject.put ("city",words[1]);
k.set (jsonObject.toString ());
return k;
}
}
基本这种数据类型格式的处理,基本都是map阶段的代码,reduce阶段和Driver阶段的代码千篇一律,要想得知其他阶段的代码,那就看我以前的博客吧,注意Drver阶段那几个参数,别弄错了