Hive
文章平均质量分 71
小马哥_编程
酷爱足球,喜欢编程,历史知识
展开
-
Hive 分区表和二级分区表的基本操作
Hive分区就是在HDFS上创建独立的文件夹,该文件夹下是该分区的所有的数据文件。Hive中的分区就是分目录,把一个大的数据集根据业务需要分割成小的数据集。在查询时通过WHERE子句中的表达式选择来查询所需要的指定分区,这样的查询效率会提高很多。1、引入分区表最终呈现的效果就是在HDFS上按照分区的目录存储文件:/user/hive/warehose/log/201801/01/dep...原创 2018-09-12 23:27:29 · 9249 阅读 · 4 评论 -
Hive 的DML操作
一、导入数据1、向表中加载数据(load)语法:hive> load data [local] inpath '/opt/module/datas/student.txt' [overwrite] into table student [partition (partcol1=val1,…)];(1)、load data:表示加载数据(2)、local:表示加载本地数据到...原创 2018-09-14 16:57:17 · 1143 阅读 · 0 评论