![](https://img-blog.csdnimg.cn/20190918140037908.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
大数据
文章平均质量分 92
大数据实战
科技改变未来
这个作者很懒,什么都没留下…
展开
-
Hive表实现一次查询多次插入需要注意的点
Hivesql里,为了提高查询效率,我们可以将通用的功能模块微服务化,除了可以使用with..as这种优化方式外,本文记录另外一种方式:如果目标表是普通表,则需要插入不同的表(tableA和tableB)from(select xx from tableA where xxx)sourcetable --需要起一个别名sourcetableinsert into tableBselect xx where xx --从sourcetable取数insert into tableCs原创 2020-06-17 18:15:24 · 4027 阅读 · 0 评论 -
HIVE外部表删除重建指定HDFS目录后查询不到数据
HIVE外部表删除重建指定HDFS目录后查询不到数据,怎么办删除了外部表,没有删除hdfs文件 重建了外部表又关联到之前的hdfs目录之后,select查询却没有数据 需要MSCK REPAIR TABLE+tablename,之后查询,数据就回来了。MSCK REPAIR TABLE命令是做啥的MSCK REPAIR TABLE命令主要是用来解决通过hdfs dfs -put或者hdfs api写入hive分区表的数据在hive中无法被查询到的问题。hive有个服务叫metastore,原创 2020-05-22 15:13:01 · 4191 阅读 · 0 评论 -
Groupings sets实现一次查询多种分组模式
这篇文章描述了 SELECT 语句 GROUP BY 子句的增强聚合功能 GROUPING SETS。GROUPING SETS 子句是 SELECT 语句的 GROUP BY 子句的扩展。通过 GROUPING SETS 子句,你可采用多种方式对结果分组,而不必使用多个 SELECT 语句来实现这一目的。这就意味着,能够减少响应时间并提高性能。在Hive 0.10.0版本中添加了 Grou...原创 2019-10-09 15:29:42 · 1317 阅读 · 1 评论