hive
akon_vm
这个作者很懒,什么都没留下…
展开
-
Hive insert into话语用法
Hive insert into语句用法 在Hive0.8开始支持Insert into语句,它的作用是在一个表格里面追加数据。 标准语法语法如下: 1 2 3 4 5 6 7 8 9 用法一: INSERT OVERWRITE TABLE tablename1 [PARTITIO转载 2014-07-15 20:57:26 · 19532 阅读 · 0 评论 -
hive分区(partition)简介
网上有篇关于hive的partition的使用讲解的比较好,转载了: 一、背景 1、在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。 2、分区表指的是在创建表时指定的partition的分区空间。 3、如果需要创建有分区的表,需要在create表的时候调用可选参数转载 2014-07-15 21:37:55 · 28973 阅读 · 1 评论 -
hive中的静态分区与动态分区
hive中创建分区表没有什么复杂的分区类型(范围分区、列表分区、hash分区、混合分区等)。分区列也不是表中的一个实际的字段,而是一个或者多个伪列。意思是说在表的数据文件中实际上并不保存分区列的信息与数据。 下面的语句创建了一个简单的分区表: create table partition_test (member_id string, name string ) partition转载 2014-07-15 21:52:17 · 1291 阅读 · 0 评论 -
Hive限制
1.更新,事务,索引,不支持,是全表扫描 2.创建表的字段类型和java类型是对应的。不支持日期类型,提供转换为字符串类型的函数。 3.查询语句中,不支持having,可写嵌套的select来解决;group by后只能是表的定义列名,不能像mysql那样可以为查询语句为逻辑处理结果声明的别名,但可为逻辑处理过程语句 4.内置函数查看命令(show functions;des转载 2014-07-29 16:09:46 · 2182 阅读 · 0 评论 -
hive SQL优化之distribute by和sort by
最近在优化hiveSQL, 下面是一段排序,分组后取每组第一行记录的SQL INSERT OVERWRITE TABLE t_wa_funnel_distinct_temp PARTITION (pt='${SRCTIME}') SELECT bussiness_id, cookie_id, session_id, funnel_id, group_转载 2014-08-05 15:41:45 · 1306 阅读 · 0 评论 -
hive QL 插入语法
1.insert 语法格式为: 基本的插入语法: INSERT OVERWRITE TABLE tablename [PARTITON(partcol1=val1,partclo2=val2)]select_statement FROM from_statement insert overwrite table test_insert select * from test_table;转载 2014-07-15 20:42:53 · 1147 阅读 · 0 评论