疑难杂症，盘点dataxweb数据迁移中遇到的坑(二)

最新推荐文章于 2024-05-16 09:34:11 发布

七夜想加薪哇

最新推荐文章于 2024-05-16 09:34:11 发布

阅读量366

点赞数

文章标签： database oracle postgresql 数据库

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_34193086/article/details/133888228

版权

1.问题描述

最近在做Oracle到Postgresql表数据的同步，采用的是datax进行数据迁移，其中几张表同步时总是报如下错误，这个报错困扰了好几天，分享一下解决过程。

2.解决过程

通过以下sql

SELECT value FROM nls_database_parameters WHERE parameter = 'NLS_CHARACTERSET';

查询出oracle的编码字符集是ZHS16GBK，而pg库是utf8编码，起初以为是pg库不支持oracle的gbk字符，在百度上找了个oracle字符集转换函数convert()，试了一下，还是报同样的错误。

然后仔细去查看所谓的脏数据，如下图

第一反应，以为是空格的存在，使用trim（）函数去出掉空格，查询出来的所谓数据，还是不行，依然报这样的错误。

纠结很久，似乎对这样的数据没有办法。

直到看到这样一条数据

正常情况下，plsql结果集中NULL值，是黄底空白显示，而这个字段是白底空白显示
说明该字段中有记录数据，而非NULL值

当我执行 select length(字段A) from table where id='xxxx'的时候，返回的结果是1，再次证明了这条数据的这个字段看起来是空值，但是其实并不是空值，这儿隐藏了一个陷阱。

试着对其转义：

select ascii(字段A) from table where id='xxxx'，结果为0，似乎是chr（0），

对应ASCII编码表中的 NUL (NULL)，但解释为空字符，在这里有些说不通，怀疑是换行符，最终也不符合条件，后来经过多方查证，在oracle里面chr(0)表示的是字符串的结束符，这就是chr(0)的陷阱。

3.解决方法

既然找到了脏数据可能存在的原因，那就可以去尝试解决了。

第一种方法:

用navicat,对oracle里面存在这样报错的所谓脏数据表，导出成excel，然后通过navicat导入到pg库，亲测成功，不过具体为什么成功的原因没有去探究。因为这种方式显然不符合我使用datax的初衷，几千条数据的表尚可，上百万条数据的表，用这种方法得累死。放弃

第二种方法：

去替换掉，oracle，表字段里的chr(0)字符，如下

REPLACE (字段A, chr(0), '')

在dataxweb，任务管理中，找寻到表A的任务，编辑，打开构建的json文件，

修改成如下

具体不知道怎么修改的，看我上一篇文章，点击保存，删除掉pg库里表A已经同步的数据，在dataxweb里点击表A的任务，执行一次，即可成功。

如果不确定某张表里，到底哪个字段包含chr(0)，可以用以下sql去查询

当然，如果你遇到一张十几年前的表，像我遇到这张表有76个字段的话，默默的含泪埋头干吧。

查询结果里，哪列结果为1，表明这个字段存在数据含有chr(0)

方案:

使用 replace([column_name],chr(0),’’)

或者 replace([column_name],chr(0),null)

第二种方案更符合datax一件同步迁移数据的方式

4.结论

oracle数据中存在 chr(0) 字符，

chr(0) 表示的是字符串的结束符

而pg中可能不支持这种字符。

七夜想加薪哇

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
疑难杂症，盘点dataxweb数据迁移中遇到的坑(二)

中的 NUL (NULL)，但解释为空字符，在这里有些说不通，怀疑是换行符，最终也不符合条件，后来经过多方查证，在oracle里面chr(0)表示的是字符串的结束符，这就是chr(0)的陷阱。具体不知道怎么修改的，看我上一篇文章，点击保存，删除掉pg库里表A已经同步的数据，在dataxweb里点击表A的任务，执行一次，即可成功。第一反应，以为是空格的存在，使用trim（）函数去出掉空格，查询出来的所谓数据，还是不行，依然报这样的错误。去替换掉，oracle，表字段里的chr(0)字符，如下。
复制链接

扫一扫

七夜想加薪哇

CSDN认证博客专家 CSDN认证企业博客

码龄8年

17: 原创

15万+: 周排名

9万+: 总排名

1万+: 访问

: 等级

347: 积分

125: 粉丝

171: 获赞

10: 评论

138: 收藏

私信

关注

热门文章

最新评论

postgresql批量修改表的owner
七夜想加薪哇: 谢谢夸奖
postgresql批量修改表的owner
Mr鬼斗: 这个好
分享一个免费的微信AI机器人
CSDN-Ada助手: 恭喜你发布了第14篇博客！分享一个免费的微信AI机器人这个主题非常有趣和实用，相信会对很多人有所帮助。希望你能继续保持创作的热情和努力，不断分享更多有价值的内容。或许下一步可以考虑深入探讨该机器人的应用场景、技术原理或者优化方向，让读者能够更全面地了解和使用。期待你更多精彩的文章！
微信机器人Midjourney AI绘画分享
CSDN-Ada助手: 恭喜您撰写了第15篇博客！看到您分享了关于微信机器人Midjourney AI绘画的内容，让人倍感兴奋。希望您能继续保持创作的热情和动力，不断探索新的创作领域和主题。或许下一步可以考虑深入探讨Midjourney AI绘画的技术原理或者与其他艺术形式的结合，让读者能够更全面地了解这项技术。期待您的下一篇作品！
Java 23种设计模式之单例模式(五)
CSDN-Ada助手: 恭喜您写了第13篇博客，内容涉及Java 23种设计模式之单例模式，非常值得称赞！您的持续创作精神令人钦佩。希望您在接下来的创作中，可以继续深入探讨单例模式的实际应用场景，或者可以考虑分享其他设计模式的相关知识，让读者能够获益更多。期待您更多精彩的分享，加油！

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。