Hive
Mayny
这个作者很懒,什么都没留下…
展开
-
Hive初识(一)
LOAD DATA语句一般来说,在SQL创建表后,我们就可以使用INSERT语句插入数据。但在Hive中,可以使用LOAD DATA语句来插入数据。LOAD DATA [LOCAL] INPATH 'filepath' [OVERWRITE] INTO TABLE tablename [PARTITION(partcol1=val1,partco2=val2...)]LOCAL是标识符指定本地路径...原创 2018-07-11 15:50:54 · 902 阅读 · 0 评论 -
Hive初识(二)
Hive分区Hive组织表到分区。它是将一个表到基于分区列,如日期,城市和部门的值相关方式。使用分区,很容易对数据进行部分查询。表或分区是细分成桶,以提供额外的结构,可以使用更高效的查询的数据。桶的工作是基于表的一些列的散列函数值。例如,一个名为Tab1表包含雇员数据,如id,name,dept和yoj(加盟年份)。假设需要检索所有在2012年加入,查询搜索整个表所需的信息员工的详细信息。但是,如...原创 2018-07-11 16:35:52 · 164 阅读 · 0 评论 -
Hive初识(三)
根据用户的需求创建视图。可以将任何结果集数据保存为一个视图。视图在Hive的用法和SQL视图用法相同。它是一个标准的RDBMS概念。我们可以在视图上执行所有DML操作。创建一个试图可以创建一个试图,在执行SELECT语句的时候,语法如下:CREATE VIEW [IF NOT EXISTS] view_name [(column_name [COMMENT column_comment], ......原创 2018-07-11 16:53:34 · 174 阅读 · 0 评论 -
Hive初识(四)
Hive本质上是一个数据仓库,但不存储数据(只存储元数据(metadata)),用户可以借助Hive使用sql对存储在分布式文件系统中的大数据集进行读写Hive查询语言(HiveQL)是一种查询语言,Hive处理在Metastore(元数据存储)分析结构化数据。SELECT语句用来从表中检索的数据。WHERE子句中的工作原理类似于一个条件。它使用这个条件过滤数据,并返回给出一个有限的结果。语法:下...原创 2018-07-13 16:29:58 · 231 阅读 · 0 评论