Hive
J1nX1N
这个作者很懒,什么都没留下…
展开
-
Hive学习总结(版本:1.2.1)
1、Hive架构Hive:由 Facebook 开源用于解决海量结构化日志的数据统计。Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张表,并提供类 SQL 查询功能。用户接口:ClientCLI(hive shell)⃝JDBC/ODBC(java 访问 hive)⃝WEBUI(浏览器访问 hive)元数据:Metastore元数据包括:表名、表所属的数据库(默认是 default)表的所有者 列/分区字段 表的类型(是否是外部表)表的数据所在目录等;默认存储在原创 2020-09-02 10:47:44 · 252 阅读 · 0 评论 -
Hive窗口函数理解
窗口函数 一直对Hive窗口函数半知半解,最近一直在学习相关知识,记录一下自己的理解。 首先是窗口函数出现的概念,指定分析函数工作的数据窗口大小,这个数据窗口大小可能会随着行的变化而变化; 概念比较抽象,字都认识,放一块就不知道啥意思了。。。再来说说窗口函数应用的场景,因为之前我们接触过聚合函数,比如sum(),avg(),max()等,而且原创 2020-09-01 22:08:40 · 257 阅读 · 0 评论 -
Hive的一些小笔记01
1 where和Having的区别(1)where可以用在select、update、delete等多种语句中,而having只能用在select语句中;(2)where 子句在聚合之前起作用,不能放在 GROUP BY 子句之后;having 子句在聚合之后起作用,不能放在 GROUP BY 子句之前;(3)where子句中的条件表达式having都可以跟,而having子句中的有些表达式where不可以跟;比如having子句可以用集(/聚)合函数(sum、count、avg、max和min),原创 2020-08-24 21:00:29 · 120 阅读 · 0 评论