在数据量呈指数级增长的当下,复杂关系数据的处理成为众多企业面临的关键挑战。传统数据库在处理这类数据时逐渐力不从心,图数据库却凭借独特优势崭露头角。蚂蚁集团的 TuGraph,作为图数据库领域的佼佼者,备受瞩目。
图数据库擅长处理复杂关系数据。以员工与公司、项目、好友间的关系为例,用关系数据库查询员工 A 和 C 的直接关系,需在多个表中查找匹配;而图数据库只需查找 A 到 C 长度为 1 的路径,简洁高效。这种贴近人类思维的抽象模式,能更直观地展现数据关联,但对计算机执行能力要求更高。随着计算机硬件性能提升和软件优化,图计算成为未来数据处理的重要方向。
蚂蚁集团业务涉及海量关联图数据,像数字支付、用户信贷、中小企业信贷等场景,数据规模庞大,这使得集团对图计算系统需求迫切。然而,构建图计算系统困难重重,如通信量大、查询数据量大、需求多样(涵盖实时、近线、离线)等。为应对这些挑战,蚂蚁推出全栈解决方案 TuGraph。
TuGraph 功能丰富,涵盖图应用、图计算、图存储等多个层面。在图应用方面,广泛用于风险控制、反洗钱、反套现、排产调度等场景;图计算支持在线查询、实时计算、近线计算、离线分析和图学习;图存储提供多版本统一接口,融合多种存储方式。其技术优势显著:性能上,是 LDBC SNB 图数据库基准测试世界纪录保持者;存储基于完美哈希,理论最优;还深度参与行业标准制定。
TuGraph 产品体系完备,包括开源产品和商业化产品。开源的 TuGraph-DB 单机版图数据库,支持 TB 级数据量和百亿级点边,性能卓越,集成了快速的图计算系统 TuGraph-Compute,运维成本低,且提供丰富工具和通用接口,旨在拓展应用生态、推动基础研究和标准成型。商业化产品矩阵涵盖分布式图数据库 TuGraph-DB Pro、离线图计算引擎 TuGraph-Compute、流式图计算引擎 TuGraph-DataFlow 以及一站式图平台 TuGraph-Platform。这些产品具备高吞吐、低延迟、可扩展、高可靠等特性,支持多地容灾和强一致性,能满足不同业务场景需求,在蚂蚁内部经受住了大规模业务考验,还广泛应用于金融、电信、工业、互联网等多个行业。
尽管 TuGraph 成绩斐然,但图计算普及仍面临诸多难题,如易用性不足(事务隔离等级低、工具少、可靠性待验证)、性能有待优化(存在分布式事务和随机访问问题)、成本较高(内存和 CPU 资源消耗大)、生态不够完善等。未来,需在这些方面持续改进,加强技术创新和生态建设,推动图计算技术更好地服务于各行业。