![](https://img-blog.csdnimg.cn/20201014180756757.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
蓦然_
大数据开发,公众号:旧时光大数据
展开
-
Hive的用户自定义函数实现步骤与流程
用户创建的UDF使用过程如下:第一步:继承UDF或者UDAF或者UDTF,实现特定的方法;第二步:将写好的类打包为jar,如hivefirst.jar;第三步:进入到Hive外壳环境中,利用add jar /home/hadoop/hivefirst.jar注册该jar文件;第四步:为该类起一个别名,create temporary function mylength as 'com.whut.StringLength',这里注意UDF只是为这个Hive会话临时定义的;原创 2023-05-25 13:03:40 · 808 阅读 · 0 评论 -
Hive Beeline连接报错:Error: Could not open client transport with JDBC Uri: jdbc:hive2://hadoop102:10000
Hive Beeline连接报错:Error: Could not open client transport with JDBC Uri: jdbc:hive2://hadoop102:10000原创 2022-11-27 15:19:51 · 1457 阅读 · 0 评论 -
Hive初始化元数据库出现错误:Error: FUNCTION ‘NUCLEUS_ASCII‘ already exists.
Hive初始化元数据库出现错误:Error: FUNCTION 'NUCLEUS_ASCII' already exists.原创 2022-08-04 23:49:36 · 1233 阅读 · 1 评论 -
Hive内部表和外部表的区别
1)内部表数据由Hive自身管理,外部表数据由HDFS管理;2)内部表的数据存储位置是hive.metastore.warehouse.dir,默认位置:/user/hive/warehouse,外部表数据的存储位置由自己制定(如果没有LOCATION,Hive将在HDFS上的/user/hive/warehouse文件夹下以外部表的表名创建一个文件夹,并将属于这个表的数据存放在这里);3)删除内部表会直接删除元数据(metadata)及存储数据;删除外部表仅仅会删除元数据,HDFS上的文件并不会被原创 2021-07-27 11:19:09 · 1521 阅读 · 0 评论 -
Hive——Hive查询
查询语句语法:[WITH CommonTableExpression (, CommonTableExpression)*] (Note: Only available starting with Hive0.13.0)SELECT [ALL | DISTINCT] select_expr, select_expr, ...FROM table_reference[W...原创 2019-06-15 19:37:46 · 593 阅读 · 0 评论 -
Hive——DML数据操作
1、数据导入1.1 向表中装载数据(Load)1.语法hive> load data [local] inpath '/opt/module/datas/student.txt' [overwrite] into table student [partition (partcol1=val1,…)]; (1)load data:表示加载数据 (2)local:表示从本...原创 2019-06-15 18:49:23 · 224 阅读 · 0 评论 -
Hive——DDL数据定义
1、创建数据库 1)创建一个数据库,数据库在HDFS上的默认存储路径是/user/hive/warehouse/*.db。hive > create database db_hive; 2)避免要创建的数据库已经存在错误,增加if not exists判断。(标准写法)hive> create database db_hive;FAILED: Execut...原创 2019-06-15 18:27:57 · 162 阅读 · 0 评论 -
Hive——Hive数据类型
1、基本数据类型 Hive数据类型 Java数据类型 长度 例子 TINYINT byte 1byte有符号整数 20 SMALINT short 2byte有符号整数 ...原创 2019-06-15 17:54:09 · 221 阅读 · 0 评论 -
Hive——hive安装
1、Hive安装地址 1.Hive官网地址 http://hive.apache.org/ 2.文档查看地址 https://cwiki.apache.org/confluence/display/Hive/GettingStarted 3.github地址 https://github.com/apache/hive2、Hive安装...原创 2019-06-14 20:51:40 · 271 阅读 · 0 评论 -
Hive——基本概念
1、什么是HiveHive:由Facebook开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类SQL查询功能。本质是:将HQL转化成MapReduce程序1)Hive处理的数据存储在HDFS2)Hive分析数据底层的实现是MapReduce3)执行程序运行在Yarn上2、Hive的优缺点...原创 2019-06-14 20:12:41 · 463 阅读 · 0 评论