大数据 - Hive
goldmei88
程序猿
展开
-
走近大数据之Hive入门(目录)
走近大数据之Hive入门一、概述二、Hive的体系结构三、Hive的安装四、Hive的管理五、Hive的数据类型六、Hive的数据模型...原创 2019-04-07 11:22:17 · 380 阅读 · 0 评论 -
走近大数据之Hive进阶(五、Hive的子查询)
HIVE子查询 hive只支持from和where子查询select e.ename from emp e where e.deptno in (select e.deptno from dept d where d.dname='SALES' or d.dname='ACCOUNTING'); 注意的问题:1、语法中的括号2、合理的书写风格3、主查询和子查询可以不是同...原创 2019-05-11 18:17:42 · 1243 阅读 · 0 评论 -
走近大数据之Hive进阶(四、Hive的表连接)
HIVE表连接(转换成mapreduce作业,提交到hadoop上)一、Hive等值连接和不等值连接等值连接(连接条件中为等号):select e.empno, e.ename, e.sal, d.dname //选择要查询的字段from emp e, dept d //选择表,并取别名where e.deptno=d.deptno; //条件是表e的deptno等于表d的de...原创 2019-05-11 12:39:25 · 669 阅读 · 0 评论 -
走近大数据之Hive进阶(一、Hive数据的导入)
一、使用Load语句进行数据的导入-语法:LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE]INTO TABLE tablename [PARTITION (partcoll = vall, partcol2 = val2 ...)]*将student01.txt数据导入t2 (t2表没有指定分隔符)load data loca...原创 2019-05-11 11:48:01 · 396 阅读 · 0 评论 -
Hive中实现group_concat功能(不用udf)
hive>desct;OKidstringstrstringTimetaken:0.249secondshive>select*fromt;OK1A1B2C2DTimetaken:0.209seconds在H...转载 2019-05-09 16:40:35 · 3179 阅读 · 0 评论 -
走近大数据之Hive进阶(七、开发Hive的自定义函数)
Hive自定义函数实现细节: 1.自定义UDF需要继承org.apache.hadoop.hive.sql2.需要实现evaluate函数,evaluate函数支持重载3.把程序打包放到目标机器上去4.进入hive客户端,添加jar包:- hive>add jar /root/training/udfjar/udf_test.jar5.创建临时函数:- hiv...原创 2019-05-19 10:43:41 · 181 阅读 · 0 评论 -
查看Hive中表的所有信息(结构、字段、存放路径、属性)
目录1. 查询创建表信息(show create table)2. 查询表的字段信息(desc)3. 查看表的详细属性信息(desc formatted)4.查看表的详细信息(describe extended)5. 查看表的partitions信息(show partitions )1. 查询创建表信息(show create table)里面有delemited...原创 2019-05-06 17:45:23 · 40947 阅读 · 0 评论 -
hive查找函数并查看函数使用方法
1、先进入到hive2、查看month相关的函数show functions like '*month*'输出如下:3、查看add_months函数的用法desc function add_months;3. 查看 add_months 函数的详细说明并举例desc function extended add_months;...原创 2019-05-05 17:28:23 · 1777 阅读 · 0 评论 -
走近大数据之Hive入门(六、Hive的数据模型)
目录一、Hive的数据存储二、内部表(Table)三、分区表(Partition)四、外部表(External Table)五、桶表(Bucket Table)六、视图(View)一、Hive的数据存储 基于HDFS(Hadoop的数据仓库) 没有专门的数据存储格式(默认的情况下采用'\t'(制表符)作为列与列之间的分隔符) 存储结构主要包括:...原创 2019-05-04 11:49:00 · 279 阅读 · 0 评论 -
走近大数据之Hive入门(五、Hive的数据类型)
目录一、基本数据类型二、复杂数据类型三、时间数据类型一、基本数据类型整数类型:tinyint/smallint/int/bigint浮点数类型:float/double布尔类型:boolean字符串类型:string(包含:string、varchar、char)>create table person (pid int, pname string, ma...原创 2019-05-04 10:57:11 · 272 阅读 · 0 评论 -
走近大数据之Hive入门(四、Hive的管理)
目录一、Hive的管理之CLI方式二、Hive的管理之web界面方式三、Hive的管理之远程服务一、Hive的管理之CLI方式hive的进入和退出进入hive命令行1:hive -- service cli 进入hive命令行2:hive 退出hive命令:1、exit 2、quit常用的CLI命令清屏:Ctrl+L 或者 !clear 查看数据仓库中表:sho...原创 2019-04-27 17:43:14 · 565 阅读 · 0 评论 -
走近大数据之Hive进阶(三、Hive的内置函数)
目录一、Hive数学函数二、Hive字符函数三、Hive收集函数和转换函数四、Hive日期函数五、Hive条件函数六、Hive聚合函数和表生成函数一、Hive数学函数round 四舍五入 前面是小数,后面是取整位数ceil 向上取整floor 向下取整二、Hive字符函数字符串转换成小写:lower 字符串转换成大写:upper ...原创 2019-04-22 22:16:05 · 369 阅读 · 0 评论 -
走近大数据之Hive进阶(二、Hive的数据查询)
目录一、简单查询和fetchtask二、在查询中使用过滤三、在查询中使用排序一、简单查询和fetchtask1、Hive查询的基本语法语法跟sql语法基本相似SELECT * FROM user与 SELECT name, gender FROM user的区别?SELECT *全表扫描不会开启MapReduce作业,SELECT name, gen...原创 2019-04-21 11:13:32 · 571 阅读 · 0 评论 -
走近大数据之Hive进阶(目录)
走近大数据之Hive进阶一、Hive数据的导入二、Hive的数据查询三、Hive的内置函数四、Hive的表连接五、Hive的子查询六、Hive的客户端操作七、开发Hive的自定义函数八、课程总结...原创 2019-04-21 10:46:19 · 279 阅读 · 0 评论 -
走近大数据之Hive入门(三、Hive的安装)
目录一、Hive的安装模式二、Hive安装之嵌入模式三、Hive安装之远程模式和本地模式一、Hive的安装模式下载地址:http://archive.apache.org/dist/找到Hive,选择要安装的版本Hive是基于Hadoop之上的一个数据仓库工具,所以按照Hive之前需先安装Hadoop环境Hadoop安装:(进行中。。。)...原创 2019-04-07 17:12:29 · 341 阅读 · 0 评论 -
走近大数据之Hive入门(二、Hive的体系结构)
目录一、Hive的体系结构之元数据二、Hive的体系结构之HQL的执行过程三、Hive的体系结构一、Hive的体系结构之元数据Hive将元数据存储在(metastore),支持mysql,derby等数据库 (默认存放在derby数据库中)Hive中的元数据包括表的名字,表的列和分区及其属性,表的属性(是否为外部表),表的数据所在目录。二、Hive的体系结构之...原创 2019-04-07 12:30:18 · 428 阅读 · 0 评论 -
走近大数据之Hive入门(一、概述)
目录一、数据仓库二、什么是Hive注意一、数据仓库数据仓库是一个面向主题的、集成的、不可更新的、随时间不变化的数据集合,它用于支持企业或组织的决策分析处理。OLTP应用:联机事务处理,关注的是事物的处理,典型的OLTP应用是银行转账,一般操作频率会比较高;OLAP应用:联机分析处理,主要面向的是查询,典型的OLAP应用是商品推荐系统,一般不会做删除和更新,数据...原创 2019-04-07 11:30:45 · 436 阅读 · 0 评论 -
走近大数据之Hive进阶(六、Hive的客户端操作)
通过jdbc的方式操作hive需要开启相关服务hive --service hiveserver //开启hive远程服务,以便jdbc远程连接一、Hive的JDBC客户端操作新建Java项目需要用到的jar包,这些jar包在hive的lib目录下,或者hadoop的lib目录下都能找到代码如下:二、Hive的Thrift客户端操作...原创 2019-05-16 23:27:44 · 219 阅读 · 0 评论