1. 引言
近期在学习大数据的过程中,使用了CDH版本的Hadoop、Hive等,将编写Hive自定义函数UDF的过程记下来,以备查看和参考。
2. 环境准备
开发环境:JDK1.8、IEDA 2018.3.5
操作环境:安装了CDH版本的大数据组件的Linux系统(虚拟机),包括了Hadoop、Hive、Sqoop
3. 实现过程
3.1 搭建IDEA开发环境
(1)贴上pom.xml的内容
<?xml version="1.0" encoding="UTF-8"?>
<project xmlns="http://maven.apache.org/POM/4.0.0"
xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance"
xsi:schemaLocation="http://maven.apache.org/POM/4.0.0 http://maven.apache.org/xsd/maven-4.0.0.xsd">
<modelVersion>4.0.0</modelVersion>
<groupId>com.fanling</groupId>
<artifactId>hivedemo</artifactId>
<packaging>jar</packaging>
<version>1.0.0</version>
<repositories>
<repository>
<id>cloudera</id>
<name>cloudera-repository</name>
<url>https://repository.cloudera.com/artifactory/cloudera-repos/</url>
<layout>default</layout>
<releases>
<enabled>tr