Hive
文章平均质量分 78
legendlee110
这个作者很懒,什么都没留下…
展开
-
Hive的学习笔记之基本概念
Hive是什么?Hive是基于Hadoop的一个数据仓库工具,可以将结构话的数据文件映射成一张表,Hive底层的数据存储用的是HDFS,数据的统计计算都是用的MapReduce,可以将Hive理解成一个MapReduce的工具,你写的Hql语句会翻译成mapreduce任务去执行。Hive的架构图用户接口:包括CLI、JDBC/ODBC、WebGUI。其中,CLI(command line...原创 2018-12-22 17:34:22 · 106 阅读 · 0 评论 -
Hive的基本操作
启动Hive第一种方式,直接进入bin目录下输入hive即可。第二种方式:第一步:后台启动hiveserver2服务端nohup hive --service hiveserver2 &第二步:在bin目录下输入beeline指令然后输出!connect jdbc:hive2://node03:10000连接到hive的客户端第三步:输入用户名密码即可进入数据库的操作...原创 2018-12-22 21:45:43 · 300 阅读 · 0 评论 -
Hive中排序常用的一些关键字的区别
order by全局排序,只有一个reducetask,数据量比较大的话排序会比较慢。sort by只对每个reduce内部的数据进行排序distribute by类似于分桶的功能,或者说MR当中的分区,主要是按照指定的字段,将数据划分到不同的reduce里面去。Cluster by相当于sort by+distribute by.如果order by排序的字段和distribu...原创 2019-01-06 10:53:32 · 2476 阅读 · 0 评论 -
Hive中表之间的连接
join查询内连接查询什么是内连接查询?内连接查询就是查询两张表的交集部分。隐式内连接查询select * from a,b where a.id=b.id;显式内连接查询一般称为标准的内连接查询,用inner join 连接两张表。on接查询的条件。select * from a inner join b on a.id=b.id;外连接查询外连接查询又分为左外连接和右外连...原创 2019-01-06 22:19:41 · 1431 阅读 · 0 评论 -
Hive中的join连接
内连接内连接查询的结果:两表的交集(公共部分)。隐式内连接语法:select 列名 , 列名 … from 表名1,表名2 where 表名1.列名 = 表名2.列名;select * from a,b where a.id = b.id;举例:select * from a,b where a.列名 = b.列名在产生两张表的笛卡尔积的数据后,通过条件筛选出正确的结果。显式内...原创 2019-01-06 22:25:28 · 288 阅读 · 0 评论