![](https://img-blog.csdnimg.cn/20201014180756738.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
爱码士王小刀
这个作者很懒,什么都没留下…
展开
-
ROLLUP以及Cube的使用
ROLLUP 运算符生成的结果集类似于 CUBE 运算符生成的结果集。下面是 CUBE 和 ROLLUP 之间的具体区别:CUBE 生成的结果集显示了所选列中值的所有组合的聚合。 ROLLUP 生成的结果集显示了所选列中值的某一层次结构的聚合。 ROLLUP 优点: (1)ROLLUP 返回单个结果集,而 COMPUTE BY 返回多个结果集,而多个结果集会增加应用程序代码的复杂性。 (2)ROLLUP 可以在服务器游标中使用,而 COMPUTE BY 则不可以。 (3)有时,查询优原创 2020-08-26 11:10:24 · 2847 阅读 · 0 评论 -
hive的事务支持
背景介绍在0.13.0版本之前,hive只能进行块级事务的操作,由于hive是基于HDFS的操作,所以都是以块为单位进行存储继0.13.0版本之后,hive开始支持事务处理,也就是说hive可以支持以行为单位的原子性操作,以及具有acid的特性(atmoic原子性 consistency 一致性 isolation 隔离性 durability 永久性) hive配置...转载 2018-12-13 15:23:14 · 2707 阅读 · 0 评论 -
对实体 "useSSL" 的引用必须以 ';' 分隔符结尾。
今天在定义数据源的时候,在配置context.xml文件时,连接mysql数据库的url一行发生错误,报错:“对实体 "useSSL" 的引用必须以 ';' 分隔符结尾”。以下是我配置数据源的代码:<Resource name="jdbc/BookDB" auth="Container" type="javax.sql.DataSource"username="root"pass..转载 2019-01-29 14:59:24 · 1883 阅读 · 1 评论 -
hive 中orc存储格式
一、ORC File文件结构 ORC的全称是(Optimized Row Columnar),ORC文件格式是一种Hadoop生态圈中的列式存储格式,它的产生早在2013年初,最初产生自Apache Hive,用于降低Hadoop数据存储空间和加速Hive查询速度。和Parquet类似,它并不是一个单纯的列式存储格式,仍然是首先根据行组分割整个表,在每一个行组内进行按列存储。ORC文件是自描...转载 2019-07-02 18:00:03 · 3497 阅读 · 0 评论 -
sql窗口函数介绍以及常用的几个功能
窗口函数可以进行排序,生成序列号等一般的聚合函数无法实现的高级操作。窗口函数也称为OLAP函数,意思是对数据库数据进行实时分析处理。窗口函数就是为了实现OLAP而添加的标准SQL功能。窗口函数语法:其中[]中的内容可以省略<窗口函数> over ([partition by <列清单>] order by <...转载 2019-07-29 14:24:01 · 1289 阅读 · 0 评论 -
hive表增加字段更改字段注释的方法
新增字段:alter table XXXX add columns(XXXXX);修改注释:use XXX;(数据库名字)alter table xxx(表名) change xxx(要更改的列名) xxx(更改后的列名) string(更改后的类型) COMMENT'xxxxx注释’;...原创 2019-08-08 16:19:58 · 5033 阅读 · 0 评论