利用udf函数将hive统计结果直接插入到mysql

最新推荐文章于 2024-04-19 16:58:19 发布

iteye_20270

最新推荐文章于 2024-04-19 16:58:19 发布

阅读量173

点赞数

分类专栏： Hive 文章标签： Hive

本文链接：https://blog.csdn.net/iteye_20270/article/details/82582359

版权

Hive 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

大部分利用hive做数据分析的步骤是先用hive将统计结果导出到本地文件或者Hive的其他表中，再将本地文件导入到mysql或者利用sqoop将Hive表导入到mysql中。

今天同事给推荐了一个利用udf函数直接将统计结果导入mysql的方法。

步骤为

hive>add jar /usr/lib/hive/lib/hive-contrib-0.9.0-cdh4.1.2.jar;

Added /usr/lib/hive/lib/hive-contrib-0.9.0-cdh4.1.2.jar to class path
Added resource: /usr/lib/hive/lib/hive-contrib-0.9.0-cdh4.1.2.jar

hive>add jar /usr/share/java/mysql-connector-java-5.1.17.jar;

Added /usr/share/java/mysql-connector-java-5.1.17.jar to class path
Added resource: /usr/share/java/mysql-connector-java-5.1.17.jar

hive>CREATE TEMPORARY FUNCTION dboutput AS 'org.apache.hadoop.hive.contrib.genericudf.example.GenericUDFDBOutput';

hive>select dboutput('jdbc:mysql://localhost/result','root','123456','INSERT INTO dc(code,size) VALUES (?,?)',code,size) from accesslog limit 10;

注：result为mysql数据库名，dc为数据库result中的表名 dc(code,size)括号中的字段为mysql表dc字段，values(?,?)对应hive统计结果的值后面的code,size为hive表中的字段，accesslog表示hive中的表名称。

通过以上步骤即可将hive统计结果直接导入到mysql数据库中。

摘自：http://blog.csdn.net/jiedushi/article/details/8609019

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

iteye_20270

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Hive学习之路(五):使用自义定函数UDF完成日志数据统计

萧邦主的城邦

04-16

1401

内容简介一、Hive自定义函数UDF简介二、数据准备1.分析日志数据2.需求3.创建原始数据表并导入数据三、使用自义定函数完成日志数据统计1.创建Java工程，添加Maven支持2.创建类LogParser并编写代码3.将代码打包并提交4.执行程序查看结果四、总结一、Hive自定义函数UDF简介上一节中，介绍了许多Hive的内置函数，并使用Hive的内置函数实现了WordCount，Hive的...

将Hive统计分析结果导入到MySQL数据库表中（三）——使用Hive UDF或GenericUDF

NIITYZU的专栏

04-23

2568

前面我分别介绍了两种Hive将分析结果导入到MySQL表的两种方式：Sqoop导入方式和使用Hive、MySQL JDBC驱动，现在我介绍第三种，也是使用比较多的方式——使用Hive 自定义函数（UDF或GenericUDF）将每条记录插入到数据库表中。一、使用UDF方式使用UDF方式实现比较简单，只要继承UDF类，并重写evaluate方法即可 1、编

参与评论您还未登录，请先登录后发表或查看评论

利用udf函数将hive数据导入到mysql

GameOverTryAgain的博客

06-14

580

hive>add jar /opt/cloudera/parcels/CDH/jars/hive-contrib-1.1.0-cdh5.11.0.jar; hive>add jar /usr/share/java/mysql-connector-java.jar; hive>CREATE TEMPORARY FUNCTION dboutput AS 'org.apache.Ha...

Hive扩展功能(三)--使用UDF函数将Hive中的数据插入MySQL中

asd315861547的博客

02-21

443

软件环境:linux系统: CentOS6.7 Hadoop版本: 2.6.5 zookeeper版本: 3.4.8主机配置:一共m1, m2, m3这五部机, 每部主机的用户名都为centos192.168.179.201: m1 192.168.179.202: m2 192.168.179.203: m3 m1: Zookeeper, Namenode, DataNode, Resourc

Hive-查询结果导入到 MySQL

dianjun2454的博客

10-10

475

step1:add jar /home/chenweidong/lib/hive-contrib-2.1.1-cdh6.0.0.jar;add jar /home/chenweidong/lib/mysql-connector-java.jar; step2:CREATE TEMPORARY FUNCTION dboutput AS 'org.apache.hadoop.hive.co...

Hive 的查询结果直接导入到 MySQL 中的方法

weixin_30410119的博客

04-26

552

步骤一： hive> add jar /setup/hive/lib/mysql-connector-java-5.1.25-bin.jar; hive> add jar /usr/lib/hive/lib/hive-contrib-0.9.0-cdh4.1.2.jar; 步骤二： hive> CREATE TEMPORARY FUNC...

hive自定义UDF编写函数.docx

01-26

Hive 自定义 UDF 编写函数本文主要讲解了 Hive 中自定义 UDF 函数的编写方法，包括创建 UDF 类、实现自定义函数逻辑、编译和打包 UDF jar 包、上传至 Hive 服务器并注册自定义函数。一、创建 UDF 类为了实现...

SparkSQL基础知识及与HIVE整合UDF函数编写

weixin_45793819的博客

04-21

1582

什么是SparkSQL 用于处理结构化数据的Spark模块可以通过DataFrame和DataSet处理数据 SparkSQL特点 1易整合可以使用java、scala、python、R等语言的API操作 2统一的数据访问连接到任何数据源的方式相同。 3 兼容hive 4标准的数据连接（JDBC/ODBC） SQL 优缺点优点：表达清晰，难度低，已学习 **缺点：**复杂的业业务需要复杂...

Hive自定义UDF函数如何在项目中使用

mj2004865_w的博客

09-12

446

对于UDF自定义函数编写规则、打成jar包、上传服务器、add jar...、create temporary function ...等这些步骤这里不作介绍，网上一大堆资料。这里说说我项目中遇到的问题。项目中我需要将mysql、sqlserver的SQL语句转换为hive能识别的hql。很简单，在项目中写一些替换代码，将SQL中的内置函数replace成hive的相关内置函数就行，例如将is...

从任意hive单表读取并计算数据写入任意mysql单表的hive工具

08-07

NULL 博文链接：https://chaoboma.iteye.com/blog/2105697

hive相关jar包

01-24

亲自测试可以用，完整的jar包，网上很多jar下载都用不了，要不就是版本不匹配，然后自己一个个调试然后一个个找过来的。希望对大家有用，我也不知道是算哪个版本的，一个个jar包找过来的，如果需要可以下载

Python中将mysql小量数据拉入Hive计算后结果再导入Mysql模板示例

BabyFish13

03-13

413

本文只是一个将Mysql里的小量表，先拉入Hive中；然后结合Hive里原已有的巨量表进行统计分析计算；最后将统计结果再导入Mysql中供查询及报表展示。仅是一个模板示例，供以后参考使用。/Users/nisj/PycharmProjects/BiDataProc/Demand/hadoopStat/anchorOperateGroup.py# -*- coding=utf-8 -*- impor...

离线数仓数据导出-hive数据同步到mysql

热门推荐

司马班如

12-12

1万+

Hive自定义UDF函数详解一、UDF概述二、UDF种类三、如何自定义UDF四、自定义实现UDF和UDTF4.1 需求4.2 项目pom文件4.3 Hive建表测试及数据4.4 UDF函数编写4.5 UDTF函数编写一、UDF概述 UDF全称：User-Defined Functions，即用户自定义函数，在Hive SQL编译成MapReduce任务时，执行java方法，类似于像MapReduce执行过程中加入一个插件，方便扩展。二、UDF种类 UDF：操作单个数据行，产生单个数据行； UDAF：操作

编写Hive的UDF(查询平台数据同时向mysql添加数据)

learn_8的专栏

04-07

248

注：图片如果损坏，点击文章链接：https://www.toutiao.com/i6812629187518530052/ 可能会有一些截图中会有错误提示，是因为本地的包一直包下载有问题，截完图已经下载好了。创建包结构创建一个基础信息类所有输出到mysql数据库中的自定义MR任务的自定义key均需要实现该抽象类代码内容，主要是实现org.apache.hado...

hive udf 源码连接mysql_Hive扩展功能(三)--使用UDF函数将Hive中的数据插入MySQL中

weixin_40000301的博客

12-22

147

软件环境:linux系统: CentOS6.7Hadoop版本: 2.6.5zookeeper版本: 3.4.8##主机配置:######一共m1, m2, m3这五部机, 每部主机的用户名都为centos```192.168.179.201: m1192.168.179.202: m2192.168.179.203: m3m1: Zookeeper, Namenode, DataNode, Re...

Hive直接读取Mysql中的数据

无知无畏的博客

09-28

1895

思考：之前做过Hive和Hbase之间的映射，那必然HIve和Mysql也可以映射，如果能实现映射,那就不需要canal实时同步增量数据了？？那如果实现了映射联查的效果咋样？实现： 1、利用三方开源项目实现映射项目地址：https://github.com/stagraqubole/Hive-JDBC-Storage-Handler或https://github.com/KironJ/hive-jdbc-storage-handler 2、打包之后上传到对应目录 2.1 打包：例如： 2.1.1：

Hive存储过程HQL/SQL（二）– 在Hive存储过程中读写MySQL表

thy822的专栏

05-17

970

关键字：Hive存储过程、PL/HQL、HQL/SQL、MySQL 通过PL/HQL可以在一个脚本中同时访问多个数据库系统。在实际业务场景中，经常会有需要将Hive和RDBMS中的数据结合分析，比如：往RDBMS中写入Hive分析的审计信息；从RDBMS中获取一些维表的数据，和Hive表进行关联；从RDBMS中读取一些配置数据；往RDBMS中保存Hive的分析结果；在PL/H

Hive自定义UDF实现：仿MySQL add_months 函数

"hive自定义UDF编写函数" 在Hive中，用户定义的函数（User Defined Functions, UDFs）允许开发人员扩展HQL的功能，以满足特定的业务需求。本资源主要介绍了如何在Hive中自定义UDF，特别是通过继承`GenericUDF`或`...