“六脉神剑”直指国产数据库选型考量因素

为了保障数据安全,推动数字化转型,大批企业开始进行数据库国产化替代,伴随而来的是数据库技术蓬勃发展,初创新兴厂商大量涌现。墨天轮中国数据库流行度排行榜显示,各类数据库产品已有200多个,这无疑给选型增加了难度。本文试图通过对国产数据库选型考量因素的总结,形成“六步走”策略,供读者参考。

1 思想上的认同,根技术和根社区保证基础软件安全

在软件根技术的垄断等因素带来的全球政治和产业链撕裂的背景下,人类社会正在从根本上逐渐摆脱对单一根技术的依赖。各国也在选择适合自身独立发展的软件根技术,避免在未来数字化时代发展中受制于人,中国也不例外。根技术概念在国内的提出无疑推动了产业界迅速聚焦攻关方向,便于产业资源的集结和对关键技术的重点突破。

在数据库领域,华为将十余年来自研的数据库企业级产品能力作为国产数据库的根技术,通过开源 openGauss 向业界开放。openGauss 具备高性能、高可靠、高安全能力,跟合作伙伴共同完善企业级特性,通过构建生态稳步推进商用落地。目前,多家厂商基于 openGauss 发布了商业发行版,实现了国产数据库从企业主导到产业主导的重要转变,促进了国产开源项目从开放治理走向自治繁荣、枝繁叶茂。

图片

2 源流上的认知,从国产数据库源流和发展思考

回顾40余年的发展历程,国产数据库大致可以分为四大流派和四大源流。四大流派包括学院派、互联网派、创业派和ICT科技派;四大源流指关系型数据库理论、Google 的分布式理论、MySQL 和 PostgreSQL 技术阵营。
在这里插入图片描述

综合四大流派来看,学院派是最早一批国内自主研发关系型数据库的企业,其发源可追溯到上世纪80年代末,以大学、科研机构为主,起步早,生态建设相对丰富完整,供应链比较完善,但是在过去很难找到关键普遍的应用场景。互联网派是近年随着互联网和开源技术的蓬勃发展,以自身业务应用场景为背景,借助多种开源技术,依托云平台,展开自身场景的磨练,推出的商业版本。该流派解决了自身应用的问题,但生态工具链不够完整,对于中小企业来说门槛较高。新兴的独立数据库创业派以及国内头部的ICT科技派企业依托自身强大的技术沉淀和积累推出了一系列具备领先的技术洞察和充分商业竞争力的国产数据库。
从四大源流来看,开源开放,自主可控的数据库更具备路线竞争力。此外,选择以类BSD协议开源的 PostgreSQL 作为国产化的根源,在知识产权上没有约束和风险,相较于被 Oracle 收购的 MySQL 更为安全。BSD许可证给予使用者很大的自由,没有后顾之忧,包括自由的使用、修改源代码,也可将修改后的代码作为开源或闭源软件再发布。但是,MySQL 对类库引用,修改后的代码以及衍生代码都必须采用GPL协议,即必须是开源和免费。所以,今天 PostgreSQL 成为大量国产数据库迭代的一个起点。

3 技术上的选择,从自身场景和业务特点出发

随着数据库行业的高速发展,越来越多的产品呈现在市场上,不同的产品,其品类特征、适用场景、评测标准也不尽相同。

以集中式和分布式数据库的选择为例,分布式数据库更适用于海量数据弹性扩展业务(如互联网游戏、互联网金融、电商、社交网络等敏态业务)与海量数据的OLAP业务(如针对海量数据的实时分析及查询等业务),这些业务对数据的强一致性要求不高,但是对数据存储量有极高的需求。分布式数据库在灵活性和扩展性方面具有优势:一方面,分布式根据其应用程序的特定需求选择软硬件的自由,不必因为共享IT架构而做出妥协;另一方面,分布式IT架构天生自带可扩展属性,能够根据业务规模实现无限弹性扩展。
相比较之下,集中式数据库更适用于一致性与稳定性要求高,复杂SQL查询快,性价比高,开发简单的场景。集中式数据库可以利用位于系统中心的服务器统一管理所有的共享资源,并处理来自用户的请求。集中式数据库积累了大量的实践经验,在强一致性、稳定性、迁移成本和运维管理方面都更胜一筹,而且各资源独立,应用隔离性好,数据安全性更高。Oracle 即集中式数据库的典范。大量测试显示在相似硬件配置环境下,绝大部分集中式数据库都有着比分布式高出一倍甚至几倍的处理能力。
在数据库的高可用和高可靠方面,不同数据库的实现原理存在较大差异。以Oracle、PostgreSQL 为代表的数据库,采用记录和传输物理日志来保证多节点间的数据一致性和高可用;以 MySQL 为代表的服务端和存储引擎端分离的数据库架构,则通过物理日志来保证实例数据一致性,在多节点的数据库同步上则采用看了逻辑日志;以 TiDB、OceanBase 为代表的分布式数据库,则是利用分布式协议来保证多个数据副本之间的一致性。
不同的方案在同步效率、同步延迟和适用场景上也不尽相同,掣肘因素也不一样。物理日志记录和传输最大程度的保证了数据的一致性,复制效率也比较高;逻辑复制相较于物理复制灵活性更高,日志量相对少,但无法严格保证节点间数据一致性。分布式数据库通过分布式协议同步事务日志,多数派写入成功事务才能提交,确保数据强一致性且少数副本发生故障时不影响数据的可用性,这样在分区的情况下保证了数据一致性,但需要数据的副本数至少为3,空间消耗较大,硬件配置要求高。
除此之外,在技术选型上,国产数据库的性能容量支撑是关键。在考量数据库性能的时候,除了可以通过公开和实际压测的TPCC数据,横向度量多个候选数据库之间的基准性能之外,还需要针对生产环境中的典型应用场景进行压力测试。同时,选型初期也需要关注国产数据库的容量支撑,如果需要替换的 Oracle 容量较大,则需要考虑选型数据库架构是否能支撑原有数据库的容量。单机数据库如果不连接外置存储,理论上只能支撑服务器能插入的磁盘、SSD卡容量的总和。分布式数据库理论上无容量限制,但节点数过多会带来性能的衰减,增加运维复杂度。
从 Oracle 数据库的特征依赖来看,如果源端的业务系统将大量的业务逻辑,通过数据库层的存储过程、函数、触发器等来实现,数据访问通道通过dblink来远程访问来进行;某些特定场景下的特殊对象调优,或者为满足程序开发过程中的便利性,使用一些非通用的对象,那么对替换的目标数据库也是一个挑战,需要具备明确的兼容性改造方案——应用改写,或者详细兼容性评估方案——兼容评估。
另外,国产数据库的替换需要关注数据库对象本身和应用对象的兼容性。数据库端主要针对表、视图、索引等基础对象和存储过程、触发器等高级对象,在不丢失语义的情况下对所有对象进行转换,使迁移替换到目标数据库后应用的功能和性能满足要求。如果遇到无法进行转换的对象,需由人工介入进行改造和规避。对应用程序中包含与目标数据库不兼容的SQL语句为应用开发方提供改造工具或改造指南,在不改变业务逻辑的情况下,对驱动程序进行适配,对应用代码进行改造。

4 产品上的成熟,从内核研发团队、金融级案例考量

数据库作为最核心的三大基础软件之一,产品的安全稳定是重中之重。一个产品从诞生到成熟,中间必然要经过严苛的打磨,而产品内核的研发工作需要高密度核心人才和大工程量的投入。

如果单纯只是拿开源代码进行封装,变成自研的国产数据库产品,厂商并不具备产品后续的持续研发、迭代更新,以及相关补丁发布的提供等能力,那么这条路必然无法走远。以 openGauss 为例,产品经历了“内部自用孵化阶段 → 联创产品化阶段 → openGauss 集中式版本开源”这3个阶段。云和恩墨更是汇聚了行业顶尖的数据库研发人才,建立贴近人才的分布式组织架构,按照共担共享的创业创新企业价值观,打造了兼具创新与活力、专业与专注的数据库核心研发团队。云和恩墨基于 openGauss 内核增强提升打造了满足金融级核心系统高并发、强一致、高可靠、稳定运行、自主可控要求的企业级商用 MogDB 数据库,助力国内多个金融用户核心业务“去O”。
在这里插入图片描述

5 生态上的繁荣,从持续建设国内数据库生态开始

在这里插入图片描述

生态是推动国产数据库发展的重要力量,决定了企业招聘人才的难度和二次开发的成本以及后续运维成本,特别是技术力量较为薄弱的政府及中小企业,对专业厂商的依赖度也相对较大。因此,他们对目标数据库厂商的生态要求更高。在替代选型的时候,为了考量总体拥有成本(TCO),选型产品厂商的生态建设也是重要考虑因素。社区活跃度、行业广度、易用性、完备的文档/书籍、应用支持、硬件适配等都是考量数据库生态繁荣的指标。

6 售后是关键,从本地化团队+生态工具+可落地流程说起

售后支持对软件来说非常重要。连续性保障能力是所有业务系统最核心的需求目标,最大化的保证业务连续性,保证系统为业务运转提供持续可靠的支撑能力是关键中的关键。因此,任何一个国产产品具备本地化的售后服务支持团队尤为重要,尤其是作为承载业务基石的数据库,遇到故障时,需要尽快排除。

为降低故障发生和实现前置化运维,及时发现与快速分析风险或隐患的能力至关重要。这要求国产产品具备良好的生态自动化工具,对故障或问题的快速发现、快速诊断定位、快速处理的协助和效率都有较高的准确度。同时,生态工具也应具备分析信息展示、逐层递进式根因下钻、智能化分析及给出处理建议的能力,从而有效缩短故障或问题从发现到解决的时间。在国产替换的实施到运维过程中,端到端可落地方法论、最佳实践的部署、异构平台的数据迁移、数据一致性校验等售后工作为国产替换提供了全流程支撑保障。
在这里插入图片描述
总的来说,用户在选择国产数据库产品时要仔细研判需求,综合考量和分析各类影响因素,才能做出最佳决策。

7 活动推荐

第十二届『数据技术嘉年华』(DTC 2023)是由中国DBA联盟(ACDU)和墨天轮社区联合主办的数据技术年度盛会,将于4月7-8日在北京新云南皇冠假日酒店举办。大会汇聚众多优秀厂商、先进技术、卓越产品和优秀案例,来自数据领域的领军人物、学术精英、技术专家、行业实践者、生态布道者带来超过60场主题演讲,相信定能为您在国产数据库选型的过程中带来有价值的参考!浏览器搜索“墨天轮”首页导航栏“技术嘉年华”,使用优惠码“ENMOTECH”报名。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值