问题描述
sparksql连接mariadb数据库迁移到达梦数据库,无法写入数据,主要log如下图:
spark报错: java.sql.BatchUpdateException: 试图在只读事务中修改数据
达梦数据库日志报错:[ERR(-6506)]
问题排查
-
错误代码[ERR(-6506)]:
select * from V$ERR_INFO where code='-6506'
-6506代表试图在只读事务中修改数据 -
spark连接数据库隔离级别的确定
例如"insert into tablexx values(?, ?, ?..)",根据rdd中的数据调用jdbc batch接口将问号替换成真正参数。
spark的JDBC接口中隔离级别一共有"NONE"、“READ_UNCOMMITTED”、“READ_COMMITTED”、“REPEATABLE_READ”、“SERIALIZABLE” 五种。spark sql中可以由参数isolationLevel来指定隔离级别,若数据库支持用户指定的隔离级别,则将最终隔离级别为用户指定的隔离级别,否则的话使用数据库的默认隔离级别。 -
达梦数据库默认隔离级别为READ_COMMITTED,spark的jdbc默认隔离级别为READ_UNCOMMITTED,按spark事务处理流程,使用隔离级别为READ_UNCOMMITTED,在达梦数据库中此级别只用于访问只读表和只读视图不能插入数据,故报错试图在只读事务中修改数据。
解决办法
在写入数据库时添加isolationLevel参数 指定隔离级别为READ_COMMITTED
df_branch.write.option("isolationLevel","READ_COMMITTED").mode(SaveMode.Overwrite).jdbc(jdbcProp.url, jdbcProp.table, jdbcProp.connectionProperties)
参考文章:
https://blog.csdn.net/m0_37809146/article/details/91281766
https://www.codercto.com/a/72350.html
https://blog.csdn.net/fengxiaozhenjay/article/details/109565309