hive
JackLi_csdn
这个作者很懒,什么都没留下…
展开
-
hive 使用
location一定不要选择“/”,一定要独立使用一个目录,否则会出现很多意想不到的错误原创 2016-05-30 19:04:35 · 284 阅读 · 0 评论 -
Hive
Hive数据仓库 可以将sql变成mapreduce任务 HIVE:HQL和MySQL语句相差不多 1.Hive不支持行级插入操作、更新操作和删除操作,同时它也不支持事务。 2.Hive中数据库的概念本质上仅仅是表的一个目录或者命名空间。如果用户没有显式指定数据库,就会默认使用默认库default。 3.默认创建的是托管表,在load时不检查数据是否符合格式,因为load是移动操作,将数据从原创 2016-04-28 16:02:33 · 676 阅读 · 0 评论 -
hive--桶
桶: set hive.enforce.bucketing = true; 使hive知道用表定义中声明的数量来创建桶create table bucketed_wyp (id int, name string, age int, tel string) clustered by (id) sorted by (id asc) into 4 buckets; <!--插入是一个mp任务--> in原创 2016-05-10 16:52:20 · 536 阅读 · 0 评论 -
日志分析hive
hadoop fs -put logs_20160522 /nginx/20160523 date=`/bin/date +%Y%m%d`/letv/data/apache-hive-0.13.1-bin/bin/hive -e "CREATE EXTERNAL TABLE if not exists nginx_20160620( host STRING, uri STRING,原创 2016-06-29 11:06:13 · 379 阅读 · 0 评论 -
hive--分区
在Hive Select查询中一般会扫描整个表内容,会消耗很多时间做没必要的工作。有时候只需要扫描表中关心的一部分数据,因此建表时引入了partition概念。分区表指的是在创建表时指定的partition的分区空间。至于用户存储的每一条记录到底放到哪个分区,由用户决定。即用户在加载数据的时候必须显示的指定该部分数据放到哪个分区。原创 2016-05-10 17:39:02 · 302 阅读 · 0 评论