sparkJDBC无法读取hive表中bigint类型字段

最新推荐文章于 2023-07-17 14:20:41 发布

十级打字员

最新推荐文章于 2023-07-17 14:20:41 发布

阅读量656

点赞数

分类专栏：大数据文章标签： hive spark

本文链接：https://blog.csdn.net/qq_39812854/article/details/122975738

版权

大数据专栏收录该内容

2 篇文章 0 订阅

订阅专栏

在最近的项目开发中遇到了一个spark无法通过jdbc从hive表中读取bigint类型字段，当数据表中有bigint类型的字段时会报如下异常：

sparkSession.read().jdbc(url,"(select id form t1) t1",ops)

Caused by: java.lang.ClassCastException: org.apache.hadoop.io.LongWritable cannot be cast to org.apache.hadoop.io.IntWritable
	at org.apache.hadoop.hive.serde2.objectinspector.primitive.WritableIntObjectInspector.get(WritableIntObjectInspector.java:36) ~[hive-serde-2.3.0.jar!/:2.3.0]
	at org.apache.hadoop.hive.serde2.objectinspector.primitive.PrimitiveObjectInspectorUtils.getLong(PrimitiveObjectInspectorUtils.java:779) ~[hive-serde-2.3.0.jar!/:2.3.0]
	at org.apache.hadoop.hive.serde2.objectinspector.primitive.PrimitiveObjectInspectorConverter$LongConverter.convert(PrimitiveObjectInspectorConverter.java:183) ~[hive-serde-2.3.0.jar!/:2.3.0]
	at org.apache.hadoop.hive.serde2.objectinspector.ObjectInspectorConverters$StructConverter.convert(ObjectInspectorConverters.java:421) ~[hive-serde-2.3.0.jar!/:2.3.0]
	at org.apache.hadoop.hive.ql.exec.FetchOperator.getNextRow(FetchOperator.java:594) ~[na:na]
	... 29 common frames omitted

经过检查、分析、实验发现当对sql添加了(row_number() over()) 函数后可以正常的读取。

sparkSession.read().jdbc(url,"(select   (row_number() over()) rn , t.* from (
select id  form t1) t ) t1",ops)

由于作者水平有限没有找到具体的错误原因，怀疑错误的原因是生产环境安装了kerberos导致。因为在开发环境下读取hive库并没有报这个错误。

十级打字员

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录