OpenAI再度扔出重磅炸弹。
近期,OpenAI公司在社交平台上宣布,其收购了领先实时分析数据库公司Rockset。
OpenAI强调,OpenAI将在其产品中整合Rockset技术,基于Rockset提供的数据索引和查询功能,使公司能够将其数据转化为可操作的智能(Actionable Intelligence)。Rockset主打实时搜索和数据分析,是基于RocksDB,Rockset将RocksDB搬到云上进行云原生化,为用户提供了更加灵活、可扩展、低成本的数据库解决方案,并且减轻了数据库存储引擎的开发时间。
如今,不管是AP还是TP领域,云原生数据库作为数据库的全新范式,以高弹性、高稳定性、低成本、普惠化的特性,为全球数据库行业提供了有价值的探索。
数据库的全新范式
在云计算出现前,关系型数据库通常采用本地部署方式,其中,商业数据库代表有Oracle、Microsoft SQL Server、IBM Db2,开源数据库代表则是MySQL、PostgreSQL。那时,大多数企业都是自行采购硬件和租用IDC。除服务器外,机柜、交换机、网络配置和软件安装等底层很多事情都需要专业人士负责。
搭建底层系统方面,传统数据库架构依赖于高端硬件,每套数据库系统可扩展的服务器少、架构相对简单,且无法支持新业务的扩展需求。如果企业想要提升性能,主要靠采用配置更高、更先进的硬件。当然,这样成本也会更昂贵。并且,它无法应对高并发读写。比如以Web 2.0为代表的网站,其数据库负载非常高,本地部署的传统关系型数据库往往无法应对每秒上万次的读写请求,硬盘I/O成为性能瓶颈。
除了扩展性差,传统关系型数据库还面临一些挑战,比如部署成本高,维护难度大;由于私有化部署,数据库内核迭代升级比较缓慢。
2010年初,随着企业上云进程的加速,大量企业开始尝试将传统数据库搬迁至云端,传统数据库逐渐从私有部署转化为云上部署,但变化主要集中在部署模式自动化,运维能力的提升,并未充分利用云计算的能力为数据库技术本身赋能。近年来,云基础设施的迅猛发展也进一步带动云数据库的应用,并且因其按需扩展和按需付费等卓越特性,受到了中小企业和互联网客户的广泛欢迎。
然而,云数据库并非专为云场景或云环境设计和构建的,没有结合云的弹性,规模扩展等能力做出特殊优化,它仅仅利用了云的资源。云数据库的部署和管理方式与传统的本地数据库相似,其存在一些固有的问题,比如存储空间浪费、计算资源浪费、数据恢复时间长以及数据延迟、系统性能受限、网络带宽消耗大、缺乏弹性扩展和自动化管理能力等,这些问题阻碍了业务的进一步发展。
例如游戏行业中,业务存在明显的流量峰谷,这种特性使得传统的数据库很难应对极致的弹性需求,从而带来资源利用率不足、运维人力成本高等问题。又比如面对秒杀和双十一等场景,传统数据库扩容后无法缩容,导致资源浪费。
这时,云原生数据库作为一种全新数据库范式被提出来,其核心是设计一种更符合“资源弹性管理”理念的数据库架构,充分利用云平台的池化资源,适应云平台的基础设施。并且,经过多次迭代更新,云原生数据库的技术也普惠到了更多的场景和部署环境,包括私有云场景,为企业提供数据安全可控的解决方案。
目前,市场中的代表产品包括阿里云PolarDB、百度智能云的云原生数据库GaiaDB、腾讯云TDSQL-C等,可以完美兼容传统的使用习惯,对交易类场景可以提供低延时的事务处理能力。同时由于借助了分布式存储池化能力,扩展性也得到了极大增强。
据Gartner预测,到2025年,基于云原生平台的数字化业务比例将达到95%,这将带来云原生数据库市场的快速增长。
市场上解决扩展性的问题除了先进的云原生存算分离架构外,还有一个方向就是采用计算节点分布式的方式实现,市场上的典型就是 OceanBase,TiDB 等。
云原生数据库——看上去很美应用有门槛
据中国信通院调研,当前57.9%的企业会考虑使用云原生数据库并将其应用到主要业务系统中,另外42%的企业还处于观望状态。从应用行业角度,互联网行业占比55.4%,而金融、制造、消费行业平均占比不超过10%。
一边是被互联网行业广泛接受和采用,另一边传统企业依然顾虑重重裹足不前,什么原因导致云原生数据库遭遇“冰火两重天”?事实上,企业在数据库技术选型过程中仍然面临挑战,比如数据库能否灵活部署?技术是否足够成熟?是否具备良好的兼容性和服务可持续性?这些问题不仅决定着云原生数据库的普及水平,很大程度上也影响着企业的业务稳定性与创新效率。
从市场上看,OceanBase、TiDB、TDSQL、PolarDB是企业选择最多的数据库产品。其中,以OceanBase、TiDB为代表的开源分布式数据库,虽然具备高度的部署灵活性,可在公有云、私有云进行随意部署,但在某些高级特性和语法上与MySQL、SQL存在差异,这可能需要更多的适配工作,从而阻碍了企业线上业务的全面开展。
TDSQL、PolarDB具有良好的语法兼容性,能够兼容绝大多数常用的MySQL语法,但其高度依赖底层专有高性能硬件,尤其是对内存和网络带宽有严格要求。如果硬件资源不足,数据库性能会受到严重影响,甚至可能导致无法正常运行。同时,两个产品不支持第三方IDC,这意味着如果用户想要使用TDSQL或PolarDB,就必须绑定使用腾讯云和阿里云提供的服务,这让用户对于云服务商的选择性大打折扣。这使得企业没有办法自由地使用云原生数据库。
当企业在选择一款扩展能力强的数据库时,顾虑主要集中在部署和使用两个环节。
首先,在数据库部署方面,云原生数据库的存算分离架构将数据存储和计算分离开来,使得存储和计算资源可以独立扩展和管理,虽然具备了良好的扩展性,但对软硬件环境存在依赖,导致类似 PolarDB,TDSQL 必须绑定使用其云服务。
其次,分布式数据库规避了部署的问题,但是在数据库使用方面,架构上的限制,导致其语法和标准的 MySQL始终有一些差异,这让企业担心陷入被绑定或者需要付出修改应用的代价,也让企业陷入两难境地。
因此,技术成熟度最高、部署最灵活、系统稳定性最好是企业选择一款数据库的关键考量标准。
可以看到,无论是OceanBase、TiDB,还是TDSQL、PolarDB,虽然这些数据库产品都是市场主流产品,但并没有降低客户使用云原生数据库的门槛。那么企业如果想保持兼容性的同时,又能灵活部署,还要稳定性好的云原生数据库还有其他选择吗?
GaiaDB的云原生数据库普惠之路
围绕选择云原生数据库的三大关键标准,百度智能云自研的云原生数据库GaiaDB应运而生。GaiaDB在设计之初就坚持的高可用、易部署、易使用的技术路线,其背后所展现出的技术普惠思想,让企业得以在通用服务器上部署并使用高性能的数据库服务,将技术创新的“果实”惠及千行百业,使企业能够真正享受到云原生数据库的价值。
从整体技术看,百度智能云GaiaDB采用存算分离的云原生架构,实现按需、极致弹性扩展能力,线上最大实例超过500TB,整体规模达到数十PB。目前已实现泛互联网、金融、人工智能、游戏、交通等全行业覆盖,不仅兼容开源生态,还在保持与单机一样的兼容性的情况下,实现了更加灵活的弹性、企业级高可用和高性价比,为用户带来新的云原生数据库体验。
此外,百度智能云GaiaDB相比其他同类型云原生数据库,有两个最鲜明的优势。
第一,数据库的易于部署是实现普惠目标的关键环节。不同于很多云原生数据库需要依赖底层高性能的硬件,GaiaDB基于通用硬件设计实现,不依赖于任何特殊硬件和基础设施,让用户可以实现云上云下一套架构,这样的方式使GaiaDB具有较强的通用性和良好的经济性。
对于大多数企业和开发者而言,简单、快捷的部署流程能够极大地降低技术采纳的门槛。很多企业出于安全合规要求或多云容灾要求,需要将数据库部署在自建IDC或跨云部署,这需要数据库产品提供更加灵活的跨平台部署能力。
对此,GaiaDB云上云下采用一套技术架构,不仅大幅降低了数据库的部署门槛,同时也降低了搭建成本。值得一提的是,GaiaDB是全球唯一能支持多云的云原生数据库,基于通用硬件实现了高性能硬件同样的效果和更好的可用性。
第二,易用性方面,GaiaDB为了方便开发人员进行调试,还开发了可以运行在笔记本上的GaiaDB Lite,这样开发人员就可以把数据库下载到自己的Mac笔记本上调试,非常方便开发人员使用。
作为一款100%兼容MySQL的云原生数据库产品,百度智能云GaiaDB良好的兼容性让用户可以保留已有的使用习惯和相关技术栈,就能够轻松地管理和使用数据库。同时,技术栈兼容可以让开发者和业务可以快速迁移到云原生数据库,既能保障100%的兼容性,又能兼容扩展能力,这使得业务的迁移更加丝滑,用户原有的技术体系和人才储备得以延续使用,全面降低了云原生数据库的迁移成本和学习成本。
在运维方面,GaiaDB引入了智能化的运维和管理功能,进一步降低了数据库的运维难度和成本。通过内置的监控、诊断和优化工具,用户可以实时了解数据库的运行状态、性能瓶颈和潜在问题,并及时进行优化和调整,极大提升了数据库的运维效率。此外,GaiaDB还支持自动备份、恢复和容灾等功能,确保数据的安全性和可用性。
为进一步降低数据库运维门槛,GaiaDB正在与大模型的能力结合,为用户提供智能的运维辅助能力,帮助数据库运维工程师高效获取数据库知识,并做出快速准确的运维决策。
在做足充分技术准备的同时,百度智能云GaiaDB还在云上提供免费版本,为高校学生、个人开发者、初创企业等初阶群体提供云原生数据库完整功能,实现云原生数据库技术的广泛应用与普及,进一步推动云原生数据库在更大范围的普惠。
今年,百度智能云GaiaDB还将发布5.0版本,重点方面会瞄着更普惠、更智能、更强大三个方向进行演进。GaiaDB 5.0将支持单主集群、Serverless,这几个关键能力都是分别满足不同场景低门槛的诉求,让用户使用GaiaDB更轻松和容易。同时,GaiaDB将在支持Copilot的基础上从开发、运维、使用多个角度利用大模型的能力进行增强,包括NL2SQL、智能运维、智能问数的能力。
百度智能云GaiaDB通过基于云计算的特性,为用户提供了有别于分布式数据库的全新使用体验,在降低数据库TCO的同时,提供极高的扩展性,同时又规避了分布式数据库带来的兼容性问题,这使得云原生数据库成为继云托管数据库之后备受市场关注的数据库方案。
技术创新永无止境。从传统关系型数据库、云数据库,再到云原生数据库,数据库技术不断变革。我们相信,以百度智能云GaiaDB为代表的云原生数据库作为支撑企业业务的关键IT基础设施,在技术普惠的驱动下,更多企业将受益于这项技术所带来的便利,更好地满足业务发展需要,通过激发数字生产力,为描绘数字未来蓝图贡献力量。
【关于科技云报道】
专注于原创的企业级内容行家——科技云报道。成立于2015年,是前沿企业级IT领域Top10媒体。获工信部权威认可,可信云、数博会、国家网安周与全球云计算等大型活动的官方指定传播媒体之一。深入原创报道云计算、人工智能、大模型、网络安全、大数据、区块链等企业级科技领域。