如何用java编写hive udf函数之hive科学计数法如何转化为数值

不想起的昵称

于 2021-08-31 15:10:04 发布

阅读量594

点赞数

分类专栏： hive 文章标签：大数据数据仓库 hadoop hive sql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_40267121/article/details/120016940

版权

hive 专栏收录该内容

42 篇文章 9 订阅

订阅专栏

1.什么是HIVE UDF函数？

hive udf即用户自定义函数（User Defined Function，简称UDF）。当hive系统函数不能满足我们需求的时候，就需要我们通过编码的方式，通过hive实现可以查询的特定功能的函数。

2.HIVE UDF函数如何实现？

只要满足两个要点

继承UDF类
实现evaluate方法

3.案例（将hive科学计数法转化为数值）

定义一个ScientificNotationTransitionUDF类继承UDF类并实现evaluate方法：

package com.udf;

import org.apache.hadoop.hive.ql.exec.UDF;
import java.math.BigDecimal;

public class ScientificNotationTransitionUDF extends UDF {
    //5.0E-4,5.0E4
    public String evaluate(String str){
        if(str.equals("") || str.equals(" ") || str.equals("null") || str.equals("NULL") || str == null || !str.contains("E")){
            return str;
        }
        String str_transf = new BigDecimal(str).toPlainString();
        return str_transf;
    }
}

4.部署

（1）package打包，并上传到服务器
（2）添加jar包，创建临时函数

spark-sql> add jar /home/hadoop/jar/learing_java-1.0-SNAPSHOT.jar;
0
Time taken: 0.552 seconds, Fetched 1 row(s)
spark-sql> create temporary function Scientific_Notation_Transition as 'com.udf.ScientificNotationTransitionUDF';
Time taken: 0.019 seconds

5.使用

spark-sql> select Scientific_Notation_Transition('1.2345E6');
1234500
Time taken: 0.76 seconds, Fetched 1 row(s)
spark-sql> select Scientific_Notation_Transition('1.2345E-6');
0.0000012345
Time taken: 0.558 seconds, Fetched 1 row(s)
spark-sql> select Scientific_Notation_Transition('null');
null
Time taken: 0.052 seconds, Fetched 1 row(s)

不想起的昵称

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
如何用java编写hive udf函数之hive科学计数法如何转化为数值

1.什么是HIVE UDF函数？hive udf即用户自定义函数（User Defined Function，简称UDF）。当hive系统函数不能满足我们需求的时候，就需要我们通过编码的方式，实现通过hive可以查询的特定功能的函数。2.HIVE UDF函数如何实现？只要满足两个要点继承UDF类实现evaluate方法3.案例（将hive科学计数法转化为数值）定义一个ScientificNotationTransitionUDF类继承UDF类并实现evaluate方法：package c
复制链接

扫一扫

专栏目录

不想起的昵称 CSDN认证博客专家 CSDN认证企业博客

码龄7年

49: 原创

10万+: 周排名

8万+: 总排名

11万+: 访问

: 等级

582: 积分

52: 粉丝

78: 获赞

15: 评论

452: 收藏

私信

关注

分类专栏

最新评论

hive秒数如何转化为时分秒
不想起的昵称: 也可以，条条大路通罗马
hive误删数据怎么找回
不想起的昵称: 是不是分割符不一致，正常映射肯定没问题
hive误删数据怎么找回
dogplays: 不起作用，即使将被删除的数据文件从回收站路径cp到原表路径后，再创建被drop掉的表，仍然无法正常查询
hive秒数如何转化为时分秒
零壹贰伍: 直接使用from_unixtime(80*60-28800,'HH:mm:ss')函数就可以
hive join中出现的数据暴增（数据重复）
不想起的昵称: 不是因为关联条件null造成的，那怎么4条记录变成6条呢？left join关联上的是2条记录，另外4条是null造成的，2*2=4，你可以理解为笛卡尔积，加起来是6。按照你这么说，那改成right join，还是6条，那是为什么？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。