spark 给hive表填加自增字段和UUID

最新推荐文章于 2024-07-05 14:14:34 发布

qq_37597249

最新推荐文章于 2024-07-05 14:14:34 发布

阅读量5.3k

点赞数

文章标签：添加UUID

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37597249/article/details/80534257

版权

直接操作表的时候用自增这个方式会报错

因为spark over里必须有字段在hive中使用
直接用SQL : create table table2Name as select row_number() over () as row_id,* from table1Name
UUID主键：也可以操作表也可以操作RDD 可以同时这种在增加UUID之后必须cache 他会一直到触发action是才会最终确认UUID的值
1、操作hive表
hc.udf.register("getUUID",()=>(java.util.UUID.randomUUID()+"").replace("-",""))
hc.sql("select getUUID() as row_id,* from table").write.saveAsTable("table2NaMe")
2、操作RDD sc.textFile("path").map(x=>{
java.util.UUID.randomUUID()+"").replace("-","") + ","+x
}).saveAsTextFile("path2")

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

qq_37597249 CSDN认证博客专家 CSDN认证企业博客

码龄8年

8: 原创

108万+: 周排名

193万+: 总排名

4万+: 访问

: 等级

424: 积分

2: 粉丝

3: 获赞

5: 评论

12: 收藏

私信

关注

热门文章

最新评论

SPARK报错java.long.Exception……org.codehaus.commons.compiler.CompileException: File 'generated.java'
卖女孩的小火柴️: 老哥，你怎么解决的呢？
SPARK报错java.long.Exception……org.codehaus.commons.compiler.CompileException: File 'generated.java'
卖女孩的小火柴️: 我也遇到一样的问题了，大家都咋解决的啊
SparkSQL报错:org.apache.spark.sql.catalyst.errors.package$TreeNodeException: execute, tree:
大数据学习僧: 前排支持一下,可以的话来我博客看看吧
SparkSQL报错:org.apache.spark.sql.catalyst.errors.package$TreeNodeException: execute, tree:
高亮: 真是个梗人，粘贴了那么大段错误
SPARK报错java.long.Exception……org.codehaus.commons.compiler.CompileException: File 'generated.java'
影帝·萌仔: 老哥怎么联系你！我现遇到的问题跟你的类似！老哥！[code=java] [/code]19/04/12 16:05:10 ERROR CodeGenerator: failed to compile: org.codehaus.commons.compiler.CompileException: File 'generated.java', Line 186, Column 17: Expression "scan_isNull7" is not an rvalue /* 001 */ public Object generate(Object[] references) { /* 002 */ return new GeneratedIterator(references); /* 003 */ } /* 004 */ /* 005 */ final class GeneratedIterator extends org.apache.spark.sql.execution.BufferedRowIterator { /* 006 */ private Object[] references; /* 007 */ private org.apache.spark.sql.execution.metric.SQLMetric scan_numOutputRows; /* 008 */ private scala.collection.Iterator scan_input; /* 009 */ private org.apache.spark.sql.execution.metric.SQLMetric filter_numOutputRows; /* 010 */ private UnsafeRow filter_result; /* 011 */ private org.apache.spark.sql.catalyst.expressions.codegen.BufferHolder filter_holder; /* 012 */ private org.apache.spark.sql.catalyst.expressions.codegen.UnsafeRowWriter filter_rowWriter; /* 01

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。