国产适配之MySQL替换为达梦8数据库

1. 背景

项目中要做国产化,MySQL要替换成达梦8数据库。项目中MySQL的建表语句和内置数据通过.sql文件维护,安装时会初始化表结构和表内置数据。项目架构为SpringBoot + JPA / Mybatis。适配工作内容包括数据库迁移、数据导出、项目中的配置更改和相关问题解决方案。

2. 数据处理流程

1. 前期装备
1. 安装达梦8数据库

达梦官网有提供安装包,根据自己的场景进行选择,linux_x86或者linux_aarch64,由于我们项目要全面国产化,所以服务器用的国产华为的鲲鹏服务器(aarch64),操作系统为国产银河麒麟V10。安装步骤按官网提供的文档就行,下载后安装包里也会有一些PDF说明文档可参考。

2. 创建库,启动

安装时如果选择了图形化界面安装,则有DM数据库配置助手工具,可用此工具来创建数据库实例,配置的话中间有个大小写是否敏感配置,此配置默认选择不敏感,否则可能后面会有坑(后面说),安装时记得把客户端也选上,后面用其客户端进行操作,其他配置的话默认就行。安装完成后其中默认用户为SYSDBA,默认端口为5236。linux环境创建数据库实例传送:dm实例创建步骤

2. 库数据处理

这一步的处理主要是将之前项目中存储的.sql文件中MySQL的表结构和表数据相关sql转换为达梦数据库所支持的sql,并且同样保存为.sql文件,后续项目运行之前直接用sql文件进行建表导数据等初始化操作。大概思想如下:

1.先把之前sql文件(MySQL)导入到MySQL数据库中

2.利用达梦的数据迁移工具把MySQL库中的数据迁移到达梦数据库中

3.利用达梦数据库迁移工具把达梦数据库中的数据导出到sql文件,此时sql文件中的sql语句就可在达梦数据库中执行

1. 数据迁移

如果安装时选择安装了客户端工具,则会生成一些客户端操作工具,如迁移工具、DM管理工具、SQL交互式查询工具等。迁移时选择DM数据迁移工具,按照工具内的步骤,选择MySQL服务和数据库以及要迁移的DM数据库。
在这里插入图片描述

1.新建迁移,按需选择,我这边是MySQL -> DM。

2.选择数据源迁移时可以指定Mysql数据库的驱动,配置一下jdbc驱动和连接参数即可。达梦的话就是用默认驱动即可。

在这里插入图片描述

3.迁移策略,可选择保持对象名大小写,如果MySQL中表字段有用到json类型的字段时,需要手动配置一下类型映射关系,将JSON转成VARCHAR,并设置长度,因为达梦没不支持json类型,迁移时他会默认转成VARCHAR,但是长度会变得很大(具体忘记了),这时某些场景查询时会报错,配置成8188即可,按图配置即可
在这里插入图片描述

在这里插入图片描述

4.后面选择迁移模式的话全选即可,没什么需要特殊注意的点

2.数据导出

第三步迁移完成后,此时达梦数据库已经有和MySQL同名的库(dm中是schema概念)和表数据了。接下来要把库中的数据导出为.sql文件,到时候放到项目中安装时用来初始化表及数据。

此时仍然需要用达梦的数据迁移工具,新建数据迁移,选择数据迁移方式为DM -> SQL,然后指定需要迁移的数据源(达梦中的scheme),然后导出到目标文件即可。

在这里插入图片描述

3. 项目适配(重点)

1. 库名问题

问题:导出后的达梦sql脚本你会发现,建表语句格式为schema.table,并且主键自增关键字变成了IDENTITY。项目中如果用SYSDBA用户连接或者别的用户连接时,执行sql语句都要加上schema(可以理解为mysql的库名,后续就说库名了),如select * from “MY_DB”.“T_USER_TEST”,如不加库名则会报错,当然不可能把项目中所有的sql都改一遍

-- mysql
CREATE TABLE `T_USER_TEST`
(
 "id" BIGINT NOT NULL AUTO_INCREMENT,//主键自增
 "name" VARCHAR(255) NULL
);
-- 达梦
CREATE TABLE "MY_DB"."T_USER_TEST"
(
 "id" BIGINT IDENTITY(1,2) NOT NULL,//主键自增
 "name" VARCHAR(255) NULL
);

解决方案:创建一个用户,用户名为库名,创建用户后达梦会自动创建一个和用户名相同的库,此时用此用户登录连接,执行sql语句时表名前面就不需要加库名了,因为他默认查的就是此用户下的库。语句如下(包括创建表空间、赋权等),后续连接时使用此账号和密码以及url连接中的schema(MY_DB)

-- 创建表空间MY_DB
CREATE tablespace MY_DB DATAFILE 'MY_DB.DBF' SIZE 128;
-- 创建用户MY_DB,密码为123456,此时会自动创建名为MY_DB的schema
CREATE USER "MY_DB" IDENTIFIED BY "123456" DEFAULT tablespace MY_DB;
-- 为MY_DB用户赋权
grant "DBA","RESOURCE","PUBLIC","SOI" to "MY_DB" with admin option;
grant EXECUTE on "SYS"."DBMS_XMLGEN" to "MY_DB";

Spring数据库连接配置参考:

#dm8连接
spring.datasource.url=jdbc:dm://127.0.0.1:5236/MY_DB
spring.datasource.username=MY_DB
spring.datasource.password=123456
spring.datasource.driver-class-name=dm.jdbc.driver.DmDriver
spring.datasource.type=com.alibaba.druid.pool.DruidDataSource

#如果项目中有使用到JPA,参考如下方言配置
spring.jpa.properties.hibernate.dialect=org.hibernate.dialect.DmDialect
spring.jpa.properties.hibernate.hbn2ddl.auto=none
spring.jpa.properties.hibernate.temp.use_jdbc_metadata_defaults=false
2. 主键自增问题
1. 问题剖析

首先,达梦数据库是支持主键自增的,DDL中自增关键字为IDENTITY,假如我们表中的id字段设置的为自增id,insert语法常见如下三种:

-- 如下建表语句,id为自增id
CREATE TABLE "MY_DB"."t_user_test"
(
 "id" BIGINT IDENTITY(1,2) NOT NULL,//主键自增
 "name" VARCHAR(255) NULL
);

-- 1.insert的正确姿势,此时会生成则增id
insert into "t_user_test"(name) values("tom");

-- 2.错误示范,此时会报错:仅当指定列列表,且SET IDENTITY_INSERT为ON时,才能对自增列赋值
insert into "t_user_test"(id,name) values(1,"tom");
-- 3.错误示范,此时会报错: 仅当指定列列表,且SET IDENTITY_INSERT为ON时,才能对自增列赋值或者违反列[id]非空约束
insert into "t_user_test"(id,name) values(null,"tom");

1.第一种插入没问题,无可厚非

2.第二种插入会报错,意思就是说,你的id设置的为自增列,但是你插入时对自增列手动赋值,这是不允许的,设置了自增就应该用数据库的自增生成。但是项目中难免有手动设置id插入的场景,此时也是有解决方案的,就是在插入之前设置IDENTITY_INSERT为ON。注意IDENTITY_INSERT关键字是表级别的关键字,语法要指定到表,不能对全库进行设置。

-- 设置t_user_test表
SET IDENTITY_INSERT MY_DB.t_user_test ON
insert into("id","name") values(1,"tom");
-- OFF可以不执行,不影响
SET IDENTITY_INSERT MY_DB.t_user_test OFF

针对IDENTITY_INSERT问题,本人做了一些测试,得出以下结论供参考:

  • 如需要使用数据库主键自增特性,需要在主键列上声明IDENTITY

  • 当insert语句时,如果手动设置id值,则需要设置此表的IDENTITY_INSERT为 ON

  • 执行完不关闭(SET IDENTITY_INSERT MY_DB.t_user_test OFF),再次插入id为空的值还是可以自增的

  • 不同会话之间执行SET IDENTITY_INSERT MY操作不会互相影响

  • 同一会话同一时刻只能有一张表IDENTITY_INSERT 设置为ON,后面会覆盖前面的,同一会话多次设置只有最后一次设置生效

  • 当insert语句中,如果id显示插入,并且value为null,则会报非空约束的问题

开启语句:SET IDENTITY_INSERT db.table ON

关闭语句:SET IDENTITY_INSERT db.table OFF

3.第三种插入报错很明显,当你没有设置IDENTITY_INSERT时,他会先报错让你对其设置为ON,如果设置完后就会报错违反id非空约束,因为id建表时为主键,自带非空约束。不能显示插入null值,此种错误只能对sql进行处理,后面会讲。

2. 问题处理

经过以上问题分析,insert某张表时,可以先设置IDENTITY_INSERT为ON,虽然只有第一种insert不需要设置,可以直接走自增,但是你设置后也不会影响insert的执行,为了偷懒不想整理项目中的sql,索性所有insert都设置IDENTITY_INSERT为ON。当然你可以写sql,修改项目中的代码,在所有insert操作之前都执行一遍INDENTITY_INSERT ON,但是代码中持久层框架用了JPA和Mybatis,并且此类sql很多,所以采用AOP的方式解决。

  • JPA

解决思路:在我们项目中使用JPA保存对象实现插入都是间接调用JpaRepository.save()方法,所以在此方法加一层拦截处理就行了,执行save之前先执行SET IDENTITY_INSERT ON,参考代码如下:

@Aspect
@Component
public class JpaSaveAspect {

    public static final String IDENTITY_INSERT_ON = "SET IDENTITY_INSERT MY_DB.%s ON";
    public static final String IDENTITY_INSERT_OFF = "SET IDENTITY_INSERT MY_DB.%s OFF";

    @Autowired
    private JdbcTemplate jdbcTemplate;

   // 节点为JpaRepository.save
    @Pointcut("execution(* org.springframework.data.jpa.repository.JpaRepository.save(..))")
    public void savePointcut() {
    }

   //执行切点方法之前要进行的处理
    @Before("savePointcut()")
    public void beforeSave(JoinPoint joinPoint) {
        Object[] args = joinPoint.getArgs();
        if (Objects.isNull(args) || args.length != 1) {
            return;
        }
        Object obj = args[0];
        Class<?> clazz = obj.getClass();
        Annotation[] annotations = clazz.getAnnotations();
        Long id = null;
        try {
            //通过反射获取save的实体对象,并通过getId方法获取里面的id值,也就是主键值
            Method method = clazz.getMethod("getId");
            id = (Long) method.invoke(obj);
        } catch (Exception e) {

        }
        // 当id(主键)为空时,不需要处理,因为此时走的数据库的自增
        if (Objects.isNull(id) || id <= 0){
            return;
        }

        for (Annotation annotation : annotations) {
            // 获取JPA实体的@Tabel注解,解析出表名
            if (annotation instanceof Table) {
                Table tableAnnotation = (Table) annotation;
                //表名拼接进sql进行执行,SET IDENTITY_INSERT MY_DB.t_user ON
                String identityInsertOn = String.format(IDENTITY_INSERT_ON, tableAnnotation.name());
                log.warn("JPA IDENTITY_INSERT_ON:{}", identityInsertOn);
                jdbcTemplate.execute(identityInsertOn);
            }
        }
    }
}
  • Mybatis

解决思路:Mybatis提供的有自己的拦截器,也叫插件,只需要自定义拦截器即可,使用方式是实现org.apache.ibatis.plugin.Interceptor接口并注册为Bean,并在Mybatis的SqlSessionFactory设置此拦截器使其生效。对这块不熟的可以网上看看相关资料。接下来拦截器中就可以拦截sql并在sql执行之前做处理了。参考代码如下:

代码处理的问题:

1.处理非法字符,如删掉sql中的`字符

2.处理boolean参数,达梦的bit类型对应java中的boolean类型,把sql中的true和false关键字替换为1和0

3.处理主键自增

在执行insert之前执行SET IDENTITY_INSERT,由于本人对Mybatis不太熟,没在拦截器中找到sqlSersion对象,也就没法通过sqlSersion来执行我自定义的sql。而通过调用jdbcTemplate等三方执行,可能导致两个sql不在一个会话中执行,也就导致可能你执行的SET IDENTITY_INSERT不在此会话生效(看上面IDENTITY_INSERT的测试结果),此时你可以通过在insert 语句所在的方法加事务尝试解决。目前我是通过拼接sql方式解决,在拦截器中把解析出来的sql前面拼接自定义sql。(会话的问题和事务我也只是猜测,并没实际验证,仅供参考)

/**
 * @description: mybatis sql拦截器,作用有三种:1.处理非法字符 2.处理boolean参数 3.处理插入主键自增问题
 */
@Intercepts({
        @Signature(type = StatementHandler.class, method = "prepare", args = {Connection.class, Integer.class})
})
@Slf4j
@Component
public class MybatisSqlInterceptor implements Interceptor {

    /**
     * 正则不区分大小写匹配"=true",包括=中间有空白字符
     */
    private static final String SQL_TRUE_PARAM_REG = "(?i)=\\s*true";
    /**
     * 正则不区分大小写匹配"=false",包括=中间有空白字符
     */
    private static final String SQL_FALSE_PARAM_REG = "(?i)=\\s*false";
    /**
     * 正则匹配insert into和merge into语句
     */
    private static final String SQL_INSERT_REG = "(?i)(insert into|merge into)\\s+([^\\s]+)";
    /**
     * 开启insert开关
     */
    private static final String IDENTITY_INSERT_ON = "SET IDENTITY_INSERT MY_DB.%s ON;";
    /**
     * 无主键的关联表
     */
    private Set<String> identityInsertExcludeTableSet;
	//配置,可配置库中无自增键的表,把它过滤掉,因为这些表没有主键自增问题
    @Value("${mybatis.insert.exclude.table:t_no_identity_table_test}")
    private String excludeTable;

    @PostConstruct
    public void initExcludeTableSet() {
        //加载时将excludeTable的表放入HaseSet,提升后续匹配效率
        identityInsertExcludeTableSet = Arrays.stream(excludeTable.split(","))
                                              .collect(Collectors.toSet());
    }

    @Override
    public Object intercept(Invocation invocation) throws Exception {
        StatementHandler statementHandler = (StatementHandler) invocation.getTarget();
        MetaObject metaObject = SystemMetaObject.forObject(statementHandler);
        MappedStatement mappedStatement = (MappedStatement) metaObject.getValue("delegate.mappedStatement");
        SqlCommandType sqlCommandType = mappedStatement.getSqlCommandType();
        BoundSql boundSql = statementHandler.getBoundSql();

        String sql = this.handleIllegalChar(boundSql.getSql());
        if (sqlCommandType == SqlCommandType.SELECT) {
            sql = this.handleBooleanParam(sql);
        }

        if (sqlCommandType == SqlCommandType.INSERT) {
            sql = this.handleIdentityInsertOn(sql);
        }
        metaObject.setValue("delegate.boundSql.sql", sql);

        return invocation.proceed();
    }

    /**
     * 处理非法字符
     *
     * @param sql
     * @return: java.lang.String
     */
    private String handleIllegalChar(String sql) {
        return sql.replace("`", "");
    }

    /**
     * 处理插入时自增id开关问题
     *
     * @param sql
     */
    private String handleIdentityInsertOn(String sql) {
        String tableName = null;
        Pattern pattern = Pattern.compile(SQL_INSERT_REG, Pattern.CASE_INSENSITIVE);
        Matcher matcher = pattern.matcher(sql);
        if (matcher.find()) {
            tableName = matcher.group(2);
        }

        if (StringUtils.isNotBlank(tableName)
                && !identityInsertExcludeTableSet.contains(tableName)) {
            String identityInsertOn = String.format(IDENTITY_INSERT_ON, tableName);
            log.warn("Mybatis IDENTITY_INSERT_ON:{}", identityInsertOn);
            sql = identityInsertOn + sql;
        }
        return sql;
    }

    /**
     * 处理sql中的布尔值
     *
     * @param sql
     * @return: java.lang.String
     */
    private String handleBooleanParam(String sql) {
        return sql.replaceAll(SQL_TRUE_PARAM_REG, "= 1")
                  .replaceAll(SQL_FALSE_PARAM_REG, "= 0");
    }
}
3. SQL语法相关问题

安装时能要求大小写不敏感尽量选择大小写不敏感,不然建表时字段都要用大写,如果用小写,查询时字段用小写查可能会报错:无效列名等

1. 字段column
字段名称关键字冲突

数据库中都有一些自己的关键字,如果建的表中有些关键字和数据库中的冲突,就有可能执行某些sql报错,此类冲突的关键字尽量手动改掉,以下是我遇到的关键字供参考:

logiccommentdomain

字段类型

1)mysql中的json类型对应dm8中的varchar类型,但尽量指定大小,不然聚合查询可能报错

2)bit类型Mysql可使用truefalse进行查询,dm只能使用01查询

2. 函数及语法

1.GROUP_CONCAT语法要换成WM_CONCAT(其它函数可自行百度,资料很多,也可参考oracle语法)

2.如果用到group by,则select的列必须都是分组内的,报错参考:不是 GROUP BY 表达式。

可根据场景看看是否能删除group by替换为select DISTINCT xxx

3.select DISTINCT对字段去重时,去重字段中不能有blob或者clob,如text类型的字段,也就是不能把text 类型的字段放到DISTINCT后面,报错参考:试图在blob或者clob列上排序或比较

4.如果使用到mysql的on duplicate key,在达梦8中可以用MERGE INTO语法进行替换(mybatis中批量插 入更新)。

5.if语句,达梦支持if语句,但只能支持简单的场景,如下

-- 支持
where if(id>1,2,3)
-- 不支持
where if(1 = 1,status = 2 or status =3 ,1=1) 

以上不支持的场景可以用逻辑解决:

where ((1 = 1 AND (status = 2 OR status = 3)) OR (1 = 1))
4. 其它问题

我们项目中用到了clickhouse数据库,并且使用了clickhouse的字典表连接了外部数据库,也就是Mysql中的某些表,作用是可以吧mysql某些表里的某些数据同步到clickhouse映射表中,并且建立好映射表后,后期clickhouse中表的数据可自动同步mysql表中的数据,如不了解的可去ck官网查看 https://clickhouse.com/docs/zh/sql-reference/dictionaries/external-dictionaries/external-dicts-dict-sources#dicts-external_dicts_dict_sources-mysql

问题:clickhouse内置支持mysql的字典表,但不支持达梦8,

解决:clickhouse提供了bridge方式,如clickhouse-jdbc-bridge、clickhouse-odbc-bridge,大概意思就是提供了个中间件,它是以独立进程来启动,他来作为ck和外部数据库的桥接来自动同步数据。

1. ODBC

环境依赖:unixODBC + 达梦8的odbc驱动

其中unixODBC可根据操作系统下载rpm包或者下载源码进行编译(网上有教程)

odbc驱动可以从安装达梦8所在的服务器上找,安装目录下有个drivers文件,里面有各种驱动,包括odbc,把驱动文件(.so)以及相关依赖拷贝到ck服务器,然后在unixODBC的配置文件中添加dm的数据源和驱动配置路径,然后再ck中创建字典表,并且指定达梦数据源。

这种方式本人在x86机器验证过,是可行的,但是unixODBC有版本问题,达梦8odbc驱动是.so文件链接库,同时有依赖其他链接库,操作不好就会有链接缺失的问题。本人就是后面x86验证后,拿到aarch64架构机器去验证时,依赖的加解密so库和系统中内置的冲突了,但是又没找到法子对其进行环境隔离,故后面放弃了。

2.JDBC

实际中本人是采用这种方式,开始没采用是因为当时看到了jdbc-bridge,但还是想找一种字典表的方式,想着看看字典表支不支持配置自定义连接数据源,就越走越远,后面又用了ODBC开始踩坑,一直踩到国产环境编译动态库后冲突问题,作为java程序员已经走不动了,就蓦然回首从0开始踩坑jdbc,中间jdbc还有一些踩坑历程就不说了,下面直接说结论吧。

clickhouse-jdbc-bridge源码地址:https://github.com/ClickHouse/clickhouse-jdbc-bridge

源码地址有说明,因为是采用java代码编写的,所以没有跨平台的问题,直接下载rpm包安装即可:

wget https://github.com/ClickHouse/clickhouse-jdbc-bridge/releases/download/v2.1.0/clickhouse-jdbc-bridge-2.1.0-1.noarch.rpm
rpm -ivh clickhouse-jdbc-bridge-2.1.0-1.noarch.rpm

1.安装后需要把达梦8的jdbc驱动放入某个文件,后面配置要指定此驱动

2.在jdbc-bridge的安装目录(默认为/etc/clickhouse-jdbc-bridge/config/datasources),新建.json文件,里面配置你的数据库相关连接(驱动、url、账号、密码等信息)

3.运行启动clickhouse-jdbc-bridge(默认端口9019)

3.配置clickhouse的config.xml文件,配置jdbc-bridge连接,重启clickhouse服务

<jdbc_bridge>
        <host>127.0.0.1</host>
        <port>9019</port>
</jdbc_bridge>

4.在clickhouse客户端执行建表语句,示例如下,其中dm8参数是clickhouse-jdbc-bridge数据源配置的名称,DM_DB是达梦数据库的schema名,后面是将查询的结果放入ck表,这个位置也可以直接写表名。

CREATE TABLE ck_user_test (
    id UInt64,
    name String 
)
ENGINE = JDBC('dm8', 'DM_DB', 'select id,name from t_dm_user_test WHERE xxx=0')

建表成功后再ck中就可以查询ck_user_test这张表了,数据同步周期可配置,具体其他配置可参考官网或自行百度

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值