md5`加密2:udf简单实现

首先编写udf的java文件

除了导入hadoop里面的jar包之外(hadoop/share/hadoop/   : common 以及common里的lib ,mapreduce 以及mapredure 里面的lib; yarn 以及yarn里面的lib)

还需要导入hive里面的lib所有jar包


接下来是java主体部分,是把之前java上实现的拿来改一些地方:

package myudf1;

import org.apache.hadoop.hive.ql.exec.UDF;

import java.io.UnsupportedEncodingException; 
import java.security.MessageDigest; 
import java.security.NoSuchAlgorithmException; 
import sun.misc.BASE64Encoder;  

public class Md5Test1 extends UDF{    
    
    public String evaluate(String str) throws NoSuchAlgorithmException, UnsupportedEncodingException{
        MessageDigest md5=MessageDigest.getInstance("MD5"); 
        BASE64Encoder base64en = new BASE64Encoder(); 
        String newstr = base64en.encode(md5.digest(str.getBytes("utf-8"))); 
        return newstr;
    }

}


然后导出成jar文件,因为没有main部分所以不是runnable jar

进入hive

ADD JAR /home/twq/Desktop/md5test.jar;

CREATE TEMPORARY FUNCTION mymd5 AS'myudf1.Md5Test1';

jar包的位置不是hdfs上,就是一般位置,服务器上随便何处

myudf1.Md5Test1 是包名.类名


接着把本地数据上传到hdfs上 

bin/hdfs dfs -put/home/twq/MySoftware/mydt/testdt.txt /tmp/input/


hive上创建对应的表

CREATE EXTERNAL TABLE tmp_dt1(
yljgdm string,
jzzdbm	 string,
jzzdsm string,
zs string,
zzms string)
ROW FORMAT delimited
FIELDS TERMINATED BY '\t'
LOCATION '/tmp/input/';

ok!

接着可以测试啦 ,show functions;的时候发现原来hive自带了这个函数,而且还和自己的md5执行结果不同,不过,能执行出来结果就好,哈哈哈哈哈哈哈



  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值