Hive
Hive入门笔记
豪华手抓饼
这个作者很懒,什么都没留下…
展开
-
Hive 09 JDBC编程
1 开启hiveserver hive --service hiveserver2 & 2 代码 代码下载 1)添加依赖 <repositories> <repository> <id>cloudera</id> <url>https://repository.clouder....原创 2018-09-07 19:08:17 · 150 阅读 · 0 评论 -
Hive 08 子查询
select e.ename from emp e where e.deptno in (select d.deptno from dept d where d.dname='sales' or d.dname='accounting'); 注意的问题: 语法中的括号 合理的书写风格 hive中只支持where和from子句中的子查询 主查询和子查询可以不是同一张表 子查询中的空值问题 ...原创 2018-09-07 17:09:44 · 142 阅读 · 0 评论 -
Hive 07 表连接
1 等值连接 select e.empno, e.ename, e.sal, d.dname from emp e, dept d where e.deptno=d.deptno; 2 不等值连接 select e.empno, e.ename, e.sal, s.grade from emp e, salgrade s where e.sal between s.losal and s.h...原创 2018-09-07 17:07:08 · 212 阅读 · 0 评论 -
Hive 06 内置函数
1 数学函数 round 四舍五入 ceil 向上取整 floor 向下取整 2 字符函数 lower upper length 字符数not字节数 concat substr trim lpad 左填充 select lpad('abcd',10,'*'); rpad 右填充 3 收集函数 select size(map(1,'tom',2,...原创 2018-09-07 17:02:43 · 168 阅读 · 0 评论 -
Hive 05 数据查询
1 简单查询 select * from table-name; select sid,sname from table-name; select sid , sname , sal , sal*12 from table-name select sid , sname , sal , comm, sal*12+nvl(comm,0) from table-name // nvl() 把空值...原创 2018-09-07 16:51:32 · 143 阅读 · 0 评论 -
Hive 04 数据导入
1 数据导入 使用load语句将外部数据导入 load data [local] inpath 'filepath' [overwrite] into table tablename [partition (partcol1=val1,partcol2=val2 ....)] 注意: 导入时注意数据的分隔符 不加local就是将HDFS上的数据导入 示例: hive> c...原创 2018-09-07 15:57:46 · 148 阅读 · 0 评论 -
Hive 03 数据存储
1 介绍 hive数据存储基于HDFS,没有专门的数据存储格式。 数据结构主要包括: 数据库 文件 表 视图 可以直接加载文本文件,创建表时可以指定hive数据的列分隔符与行分隔符。 2 表 2.1 内部表 table 1)介绍 与数据库中的table在概念是是类似的 每一个table在hive中都有一个相应的目录存储数据,所有的table数据(不包含external tab...原创 2018-09-07 15:47:48 · 224 阅读 · 0 评论 -
Hive 02 数据类型
1 基本数据类型 tinyint/smallint/int/bigint 整数类型 float/double 浮点数类型 boolean 布尔 string 字符串 2 复杂数据类型 Array 数组类型 Map 集合,键值对 Struct 结构,可包含不同数据类型 3 时间类型 Date 有格式 Timestamp 数字形式,时间戳 ...原创 2018-09-07 14:38:43 · 152 阅读 · 0 评论 -
Hive 01 概述、安装配置
1 概述 1)产生背景 MapReduce编程的不便性 HDFS上的文件缺少schema 2)是什么 The Apache Hive ™ data warehouse software facilitates reading, writing, and managing large datasets residing in distributed storage using SQ...原创 2018-08-27 10:35:19 · 245 阅读 · 0 评论