sqoop从hive导入mysql时死锁问题

最新推荐文章于 2024-03-06 11:17:08 发布

runningjin

最新推荐文章于 2024-03-06 11:17:08 发布

阅读量211

点赞数

文章标签： hive sqoop mysql

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42000536/article/details/133577682

版权

文章讲述了在将新数据源指标从Hive导入MySQL时遇到死锁问题，发现是由于指标键过长导致索引冲突。通过调整SQOOP的并行度设置为1以及考虑使用SparkSQL以提高数据传输稳定性来解决该问题。

摘要由CSDN通过智能技术生成

项目场景：

新来了一批数据源洗成指标要从hive导入到mysql中.生成的指标key是由数据源+产品编号+数据表名+维度的md5的前8位拼接而成.
例:指标key是baidu1001monthreportas55fef6ret 这样大约30个字符到45个字符之前不定.

问题描述

大约一次性导入10万条数据,数据在用sqoop从hive导到mysql时总是会报死锁问题.

Caused by: java.sql.SQLException: Deadlock found when trying to get lock; try restarting transaction

原因分析：

这个sqoop脚本之前一直是可以使用的,用这个脚本导出别的数据源的大数据量指标也是没有问题的.那么问题就出在这个数据源指标的key上.
我也尝试用其他方式去导出这部分数据,比如用sparksql写个脚本去抽取这部分数据,结果没有问题.
那么原因就出在sqoop上了,尝试去寻找了一下方法,sqoop脚本可以添加一些参数来限制数据传输的并行度.

解决方案：

–num-mappers 1 指定sqoop并行度为1

个人思考了一下原因,可是是指标key过长导致的这个问题.之前指标的key大约25个字符左右从来没出现过这个问题.过长的key导致mysql插入索引时大量数据写入一个索引下导致索引冲突引起的死锁,
之后会把sqoop脚本替换成sparksql写的脚本来完善数据传输的稳定性.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

runningjin

CSDN认证博客专家 CSDN认证企业博客

码龄6年

3: 原创

102万+: 周排名

225万+: 总排名

366: 访问

: 等级

30: 积分

0: 粉丝

0: 获赞

1: 评论

0: 收藏

私信

关注

热门文章

分类专栏

工作记录 1篇

最新评论

es模糊匹配修改数据
CSDN-Ada助手: 恭喜你写了第三篇博客！标题“es模糊匹配修改数据”听起来非常有趣。我很高兴看到你对这个主题有深入的了解，并且能够分享你的知识和经验。对于下一步的创作建议，我建议你可以考虑探讨一些与es模糊匹配相关的进阶主题，例如如何优化模糊匹配的性能或者如何处理多个字段的模糊匹配等等。这样的话，读者可以进一步了解这个主题，并且可以从你的经验中获益。希望你能继续保持创作的热情，并且继续分享你的知识和经验。谦虚的态度是非常重要的，因为技术的世界总是在不断发展进步，我们每个人都有很多可以学习的地方。祝福你在未来的创作中取得更大的成就！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。