1.编写文档目的
大多数企业在使用CDH集群时,考虑数据的安全性会在集群中启用Sentry服务,这样就会导致之前正常使用的UDF函数无法正常使用。本文主要讲述如何在Sentry环境下使用自定义UDF函数。
文章概述
- 部署UDF JAR 文件
- Hive配置
- 授权JAR文件
- 创建临时函数
- 创建永久函数
测试环境
- CM和CDH版本为6.2.1
- 采用用户
前置条件
- 集群Kerberos已启用
- 集群已安装Sentry服务且正常使用
2. 部署UDF JAR包
1.将开发好的UDF JAR包上传至HServer2及Metastore服务所在服务器统一目录
[root@dloss1 ~]# sudo mkdir /usr/lib/hive-udf-jars
[root@dloss1 hive-udf-jars]# sudo chown -R hive:hive apog-udf-1.0.jar
[root@dloss1 hive-udf-jars]# ll
(后续换了jar包)
注意:/usr/lib/hive-udf-jars目录及目录下文件的属主为hive