hive修改字段后查询不了数据

最新推荐文章于 2024-07-18 22:48:29 发布

SW_LCC

最新推荐文章于 2024-07-18 22:48:29 发布

阅读量2.2k

点赞数

分类专栏： hive

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/SW_LCC/article/details/102854676

版权

在Hive 2.1.0和Hadoop 2.6.0-cdh-5.13.3环境下，修改表结构添加字段后遇到使用MapReduce查询显示字段值为null的问题，而Spark引擎查询正常。解决方案是按照日期重新关联HDFS数据，编写执行脚本从起始日期的日志处理到最新日志。

摘要由CSDN通过智能技术生成

情况描述

hive版本为: apache-hive-2.1.0
hadoop版本为: apache-hadoop-2.6.0-cdh-5.13.3

修改添加两个字段删除一个字段，但跟日志文件数据是一一对应的。
发现修改后，在hive中用mapreduce查询这两个新加的字段，值为null。
而用hive中用spark引擎却可以找到字段的值。

hive修改字段

通过alert table tablename add column(旧字段1，旧字段2，…，旧字段N,新字段1，新字段2）
修改。

修改

在hive中，修改后发现查询旧字段时正常的，而新加的字段1,字段2值为null。
使用spark引擎，发现该数据查询正常。

解决

分区按日期分，重新关联hdfs。
写个执行脚本，从开始日期的日志当最新的日志

脚本

	#!/bin/sh
	begin = $(date +%s -d "20151101")

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

SW_LCC CSDN认证博客专家 CSDN认证企业博客

码龄9年

114: 原创

6万+: 周排名

187万+: 总排名

12万+: 访问

: 等级

1999: 积分

3: 粉丝

27: 获赞

8: 评论

88: 收藏

私信

关注

热门文章

分类专栏

RPC 1篇
spark 8篇
Linux 8篇
Redis 11篇
其他 1篇
NoSQL 1篇
HTTP 4篇
JavaWeb 6篇
mysql 7篇
hbase 1篇
算法 3篇
python
sqoop 1篇
ElasticSearch 10篇
zookeeper 1篇
分布式系统 1篇
Echarts 2篇
presto 1篇
Flink 1篇
数据库 1篇
TCP/IP 1篇
计算机网络 1篇
jquery
编程工具 1篇
hadoop 9篇
flume 12篇
java 12篇
Vim 2篇
hive 10篇

最新评论

idea行号栏太宽的问题
志犟CR_7: 只是想宽度窄一点，不是不要了
Hadoop误删文件后恢复
dintc: 要恢复的这个盘(分区)，暂时不要存入新的文件，可以用hopeData 找回资料。
java判断字符串是否日期格式
丨十一丨: 不错，感谢分享
flume AvroSource和AvroSink使用
被java耽误的愤青回复 SW_LCC: 案例的配置信息有误，，压缩方式compression-type的配置应该是"deflate"，而且sink端配置应该是a1.sinks.k1.compression-type = deflate & a1.sinks.k1.compression-level = 6 [/code]
flume AvroSource和AvroSink使用
SW_LCC 回复被java耽误的愤青: 报错信息是什么，还有你的配置文件是怎么写的

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。