MapReduce清洗实操3

首先就是上题目
在这里插入图片描述
首先就是看一下源数据和处理后的数据发生了那些变化,这里我们发现,就是他们日期格式发生了变化
现在我们需要思考的问题就是怎么样才能让他的日期格式发生变化,首先需要明白的是,我们处理的是什么呢,是字符串类型的数据,虽然他的格式是json格式的,但是归根结底还是还是字符串String类型的数据,在String中是否有方法能够有让其发生变化呢。对String类熟悉的人都知道String类中有两个方法能够实现字符的替换,replace和replaceAll方法,不知道给我查api啊
replace方法和replaceAll方法都是替换指定的字符串
replace官方给出的解释是
用指定的文字替换序列替换与文字目标序列匹配的字符串的每个子字符串。
replaceAll官方给出的解释是
将与给定正则表达式匹配的字符串的每个子字符串替换为给定的替换
对于我们这个需求来说,其实这两个都没有问题,
替换的方法我们是找到了,但是这里你还得考虑一个问题。你这个数据终究是一个json格式的数据,而且你处理的也就一个数据,我们是不是得用用json中的getString来获得指定的字符串呢,当然使用这个的前提是我们处理的是一个数组数据
分析到这里基本的思路也就全部出来了,我们先将这个字符串转化为数组,然后使用json中的方法得到对应的数据,然后使用replace方法对其进行处理,然后再讲处理后的数据给放回去
根据思路可以得到接下来的map阶段的代码,当然我这里也是用方法对其封装了

import net.sf.json.JSONObject;
import org.apache.hadoop.io.LongWritable;
import org.apache.hadoop.io.NullWritable;
import org.apache.hadoop.io.Text;
import org.apache.hadoop.mapreduce.Mapper;


import java.io.IOException;

public class MapperfWeather extends Mapper<LongWritable, Text,Text, NullWritable> {
    Text k=new Text ();
    @Override
    protected void map(LongWritable key, Text value, Context context) throws IOException, InterruptedException {
        String x = value.toString();
      k=this.text1(x);
        context.write(k,NullWritable.get());
    }
    //清晰实操3
    public Text text1(String line){
        JSONObject  jsonObject=JSONObject.fromObject (line);
        String [] words =new String[2];
        words[0]=jsonObject.getString ("date");
        words[1]=jsonObject.getString ("city");
        words[0]=words[0].replace ("-","/");
//        words[0]=words[0].replaceAll ("-","/");
        //这里要用replaceall考虑
        jsonObject.put ("date",words[0]);
        jsonObject.put ("city",words[1]);

        k.set (jsonObject.toString ());
        return k;
    }
    }

基本这种数据类型格式的处理,基本都是map阶段的代码,reduce阶段和Driver阶段的代码千篇一律,要想得知其他阶段的代码,那就看我以前的博客吧,注意Drver阶段那几个参数,别弄错了

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值