Hive
G5Lorenzo
这个作者很懒,什么都没留下…
展开
-
子查询作为数据源时需要表别名
问题描述insert overwrite table tmp partition(dt='${DT}',hour='{HOUR}')select * from (select a,b,c,dfrom t1where dt='${DT}' and hour='{HOUR}'union allselect a,b,'NULL' c,dfrom t2where dt='${DT}' and hour='{HOUR}'union all select a,b,c,dfrom t3where原创 2021-04-21 15:32:07 · 1083 阅读 · 0 评论 -
hadoop 解har归档文件
hive 解har归档文件1.问题描述同步数据的时候,发现有一天的数据查不到,也查不到分区信息,重新同步这一天的数据发现一直执行失败,后面查看hdfs上的实际存储文件发现该天的数据被归档了,归档文件同步过来了,但是msck repair table 命令没法将归档文件中的分区数据信息更新到metastore2.解决办法分区数据存在于归档文件中,那么直接将归档文件中的分区数据拷到当前分区路径下就OK了hadoop fs -cp har://scheme-hostname:port/hive/ware原创 2021-04-16 17:18:04 · 1070 阅读 · 0 评论 -
hive msck repair table 报错
hive msck repair table 报错1.问题描述msck repair table 库名.表名;报错:FAILED: Execution Error, return code 1 from org.apache.hadoop.hive.ql.exec.DDLTask2.解决办法set hive.msck.path.validation=ignore;先使用上述命令后,再执行:msck repair table 库名.表名;...原创 2021-04-16 16:58:36 · 3502 阅读 · 0 评论 -
HiveJDBC访问——hiveserver2和beeline启动和关闭
HiveJDBC访问——hiveserver2和beeline启动和关闭一、步骤:1.先在一个会话中启动hiveserver2服务[LORENZO@hadoop102 hive]$ bin/hiveserver22.再在另一个会话中启动beeline[LORENZO@hadoop1 hive]$ bin/beelineBeeline version 1.2.1 by Apache H...原创 2020-04-12 17:18:34 · 3593 阅读 · 0 评论