Hive通过自定义UDF函数实现分词

最新推荐文章于 2021-10-30 17:12:24 发布

手提青灯觅佳人

最新推荐文章于 2021-10-30 17:12:24 发布

阅读量644

点赞数

分类专栏： Hive 文章标签： hive java udf

本文链接：https://blog.csdn.net/weixin_46845300/article/details/110946796

版权

本文详细介绍了如何在Hive中通过编写Java自定义UDF函数实现文本分词，包括所需的依赖、具体实现代码、操作后得到的数据结果以及UDF函数的打包上传和创建过程。

摘要由CSDN通过智能技术生成

一、所需依赖

        <dependency>
            <groupId>org.apache.hive</groupId>
            <artifactId>hive-exec</artifactId>
            <version>1.1.0</version>
        </dependency>
        <dependency>
            <groupId>com.janeluo</groupId>
            <artifactId>ikanalyzer</artifactId>
            <version>2012_u6</version>
        </dependency>

二、实现代码

package com.link.datawarehouse.hive;

/**
 * @author 包菜
 * @date 2020/12/8 15:08
 */
import java.io.ByteArrayInputStream;
import java.io.IOException;
import java.io.InputStream;
import java.io.InputStreamReader;
import java.io.Reader;

import org.apache.hadoop.hive.ql.exec.UDF;
import org.wltea.analyzer.core.IKSegmenter;
import org.wltea.analyzer.core.Lexeme;
public class IkParticiple extends UDF {
    public String evaluate(String

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

手提青灯觅佳人

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Hive通过自定义UDF函数实现分词

一、所需依赖 <dependency> <groupId>org.apache.hive</groupId> <artifactId>hive-exec</artifactId> <version>1.1.0</version> </dependency> <dependency&gt
复制链接

扫一扫