hive ql
lvmargrete
这个作者很懒,什么都没留下…
展开
-
Hive QL
自:http://sishuok.com/forum/blogPost/list/0/6227.html 转载第一部分:DDL DDL •建表 •删除表 •修改表结构 •创建/删除视图 •创建数据库 •显示命令 建表 CREATE [EXTERNAL] TABLE [IF NOT EXISTS] table_name [(col_转载 2015-11-06 15:46:02 · 360 阅读 · 0 评论 -
Hive 表连接
hive表连接需要成转换一个mapreduce的作业提交到hadoop上完成。等值连接(连接条件“=”)不等值连接(连接条件“外连接自连接原创 2015-11-08 23:08:59 · 632 阅读 · 0 评论 -
hive的数据类型和数据模型
转载自:http://www.cnblogs.com/sharpxiajun/archive/2013/06/03/3114560.htmlhive支持两种数据类型:基本和复杂数据类型 基本包括数值型(tinyint/smallint/int/bigint/flout/double)、布尔型(true/false)、字符串型(string)、binary、ti转载 2015-12-01 15:31:13 · 831 阅读 · 0 评论 -
hive的查询注意事项以及优化总结
Hive是将符合SQL语法的字符串解析生成可以在Hadoop上执行的MapReduce的工具。使用Hive尽量按照分布式计算的一些特点来设计sql,和传统关系型数据库有区别,所以需要去掉原有关系型数据库下开发的一些固有思维。基本原则:1:尽量尽早地过滤数据,减少每个阶段的数据量,对于分区表要加分区,同时只选择需要使用到的字段select ... from Ajoin Bon转载 2015-11-09 14:52:18 · 380 阅读 · 0 评论 -
map和reduce 个数的设定 (Hive优化)经典
转载自:http://blog.sina.com.cn/s/blog_9f48885501017dua.html 谷腾龙的博客一、 控制hive任务中的map数: 1. 通常情况下,作业会通过input的目录产生一个或者多个map任务。 主要的决定因素有: input的文件总个数,input的文件大小,集群设置的文件块大小(目前为128M, 可在hive中通过set转载 2016-01-07 10:44:39 · 436 阅读 · 0 评论