2022年,中国信息通信研究院相继发布了第十四批和第十五批“可信数据库”评估评测结果,深圳计算科学研究院(简称:深算院)崖山数据库系统YashanDB参与并通过了金融场景集中式事务型数据库性能评测和分布式分析型数据库基础能力评测。今日,崖山数据库系统的生态团队负责人王龙接受了中国信通院云计算与大数据研究所的对话。
问题1:请您为我们介绍下为什么要步入数据库系统自主研发的赛道?期间遇到哪些难点?
近年来,我国软件产业规模持续扩大,盈利能力明显增强,在部分领域已具备先发优势,但核心的基础软件研究还有进步空间,我们希望打造一款拥有完全自主知识产权的产品,以可自主演进的产品架构,满足用户日益增长的业务迭代需求。目前较多数据库产品都是基于开源二次改造,有可能会因对核心代码缺乏理解而难以应对业务变化需要,只有从头开始研发,将核心技术掌握在自己手里,才是解决基础领域技术创新和满足市场变化需求的根本之道。
从0到1开发一款数据库难度非常大,通常需要较长的周期,但需求却很紧迫,崖山数据库系统团队依托研究院原创先进理论和工程团队技术积累,在较短时间周期内完成了产品的研发;另外我们还面临着高端技术人才缺乏、市场推广难等系列问题,不过在国家政策扶持以及市场应用需求的拉动下,我们有信心克服挑战。
问题2:崖山数据库系统在技术创新层面做了哪些尝试和探索?
我们认为,只有做到真正的创新,才能保持产品的持续竞争力。
我们的创新源自深算院的领先研发模式。一方面,在基础理论上,吸收了原创的国际学术前沿理论成果,融入到产品实践。例如有界计算、近似计算、并行可扩展、并行事务和跨模融合计算理论,相关成果已荣获Royal Society Wolfson Research Merit Award、ACM PODS、SIGMOD、ICDE、VLDB四大数据库国际顶级会议奖项。另一方面,在工程实践上,我们从架构到底层实现均进行了多方面的创新。例如在事务数据库的多活架构方面,实现了线性并行多活;基于运行时调度的并发事务处理,进一步提升整体性能等等;分布式分析型数据库通过异步并行、内存计算、列式存储及向量化执行等技术,可为客户提供高效的数据分析解决方案。
问题3:你们如何决定参与“可信数据库”评测工作的?通过两次评测带来了怎样的收获?
中国信通院“可信数据库”系列评估评测是国内数据库领域非常权威、标准的测试品牌,圈定了国内数据库厂商的第一梯队,是数据库产业发展的风向标,自推出以来,行业内的人气和认可度相当高,因此我们决定参加信通院“可信数据库”评测。结合产品特点,我们参加了“集中式事务型数据库性能专项评测”、“分布式分析型数据库基础能力专项评测”两项,并顺利通过。通过两次测试,除了能验证崖山数据库系统的成熟度和先进性,还可以为后续产品研发、布局等方面提供方向性指导。
问题4:崖山数据库系统主要解决用户什么问题,应用和推广情况如何?
崖山数据库系统YashanDB可满足金融、政府、央国企、能源等重点行业对高性能、高可用、高安全性的要求,支持单机、集群多活、分布式和云等多种部署形态,适用于金融级核心交易系统、类互联网业务高峰场景、ERP/CRM 等核心业务场景,一站式满足行业数据库替代和数字化转型的需求。目前,YashanDB已兼容适配国内主流软硬件生态环境,在金融、政企、能源、交通、大型央国企集团、线上零售等领域进行了深度的应用和推广。
问题5:未来将会在哪些方面加强投入?
未来,我们会持续在产品能力、人才培养、生态建设、行业赋能等方面加强建设。一是坚持自主研发的道路,从客户场景出发不断打磨自身,为客户提供具有根技术的、可适应变化的高端产品和方案;二是加快人才培训体系建设,为数据库产业培养高端技术人才;三是持续构建全链路生态,携手上下游合作伙伴为客户提供更优质的国产化解决方案;四是行业持续赋能,以点带面打造最佳实践,形成可复制推广的模式。
(以上内容转载自“大数据技术标准推进委员会”公众号)