Hive
文章平均质量分 72
youngxuebo
这个作者很懒,什么都没留下…
展开
-
group by ,grouping sets ,cube ,rollup区别
grouping sets 在一个GROUP BY查询中,根据不同的维度组合进行聚合,等价于将不同维度的GROUP BY结果集进行UNION ALL。 select month, day, count(distinct cookieid) as uv from cookie group by month,day grouping sets (month,day) 等价于: SELECT month,NULL,COUNT(DISTINCT cookieid) AS原创 2021-09-02 17:21:20 · 284 阅读 · 0 评论 -
Hive 小记
一、数据库操作 1、创建数据库 hive (mypractice)> create database if not exists db_hive; 数据库在HDFS上的默认存储路径是/user/hive/warehouse/*.db。 可能出现的报错: FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask. MetaException(message:For direct MetaSto原创 2021-06-27 16:59:37 · 108 阅读 · 0 评论 -
Hive 数据类型
Hive 基本数据类型 Hive 集合数据类型 数据类型 描述 语法示例 STRUCT 和c语言中的struct类似,都可以通过“点”符号访问元素内容。例如,如果某个列的数据类型是STRUCT{first STRING, last STRING},那么第1个元素可以通过字段.first来引用。 struct() MAP MAP是一组键-值对元组集合,使用数组表示法可以访问数据。例如,如果某个列的数据类型是MAP,其中键->值对是’first’->’John’和’last原创 2021-06-27 16:36:19 · 154 阅读 · 0 评论 -
Hive 小结。
一 Hive基本概念 1.1 什么是Hive Hive:是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供简单的sql查询功能,可以将sql语句转换为MapReduce任务进行运行(由Facebook开源,用于解决海量结构化日志的数据统计。)。 本质是:将HQL/SQL转化成MapReduce程序 1)Hive处理的数据存储在HDFS 2)Hive分析数据底层的实现是MapReduce 3)执行程序运行在Yarn上 1.2 Hive的优缺点 优点: 1)操作接口采用类SQ原创 2021-06-27 16:18:34 · 188 阅读 · 2 评论 -
在hive中执行sql语句:SemanticException org.apache.hadoop.hive.ql.metadata.HiveException:
(1)在hive中执行sql语句:show databases hive> show databases; FAILED: SemanticException org.apache.hadoop.hive.ql.metadata.HiveException: java.lang.RuntimeException: Unable to instantiate org.apache.hadoop.hive.ql.metadata.SessionHiveMetaStoreClient (2)初始化:./原创 2021-04-05 16:42:11 · 643 阅读 · 0 评论