《大数据： Hive 自定义函数》

最新推荐文章于 2023-01-18 09:00:00 发布

HarkerYX

最新推荐文章于 2023-01-18 09:00:00 发布

阅读量197

点赞数

分类专栏：【大数据：上篇】

本文链接：https://blog.csdn.net/yexiangCSDN/article/details/109163145

版权

107 篇文章 35 订阅 ¥99.90 ¥299.90

订阅专栏

本文介绍了如何在Hive中创建自定义函数，包括编写UDF，打包，安装，以及创建函数的步骤。同时，文章讨论了大数据领域的存储格式，如列式存储的ORC和PARQUET，比较了两者在压缩比和适用范围上的差异，并建议通常使用ORC格式存储数据。

摘要由CSDN通过智能技术生成

1.先编写自定义的函数

①. 引入依赖

<dependency>
	<groupId>org.apache.hive</groupId>
	<artifactId>hive-exec</artifactId>
	<version>1.2.1</version>
</dependency>

②. 自定义UDF函数，继承UDF类

③. 提供evaluate()，可以提供多个重载的此方法，但是方法名是固定的

④. evaluate()不能返回void，但是可以返回null

2. 打包

3. 安装

在HIVE_HOME/auxlib 目录下存放jar包

了解本专栏

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注