图技术前沿应用及发展趋势

【导语】

“在未来,图技术这样的创新技术将改变企业组织和使用数据的方式,实现实时数据分析、隐藏关系发掘、情境化精准决策。”——Gartner 2020

随着大数据和物联网的蓬勃发展,数据自身的丰富程度增加,数据之间的关联性增多,传统的对小数据量、单维度、静态化数据的分析已经不满足时代发展的需求,数据量的剧增、数据之间复杂关联关系的有效分析和处理成为了数据库行业的痛点。

传统的关系型数据库,在处理复杂数据关系上表现得不是很完美。而图数据库善于处理大量的、复杂的、互联的、多变的网状数据,其效率高于传统的关系型数据库千百倍甚至数万倍。

由于提供了对关联数据最直接的表达,图数据库迎来了飞速发展的态势。根据 DB Engines 近七年数据库流行趋势显示,图数据库受欢迎程度的增幅相较其他主流数据库遥遥领先。据Gartner最新研报[1] 显示,其调研的企业中已有23%在人工智能项目中部署了图技术,剩余企业将有50%于未来1-2年内部署(见图1)。图1 人工智能项目中图技术的应用[2]

图1 人工智能项目中图技术的应用[2]

目前,国内越来越多的厂商进入图数据库领域,图数据库也已在社交、金融等领域发挥了重要作用。本文通过总结Gartner 2020至2021年间发布的数篇行业研究报告,综述了图技术在知识图谱、智慧医疗、政务治理、供应链管理、数据资产管理、客户关系管理等领域中的前沿应用,为大家带来最前瞻的行业观察。

1. 知识图谱

知识图谱即Knowledge Graph,它以结构化的方式描述客观世界中实体、概念、事件以及之间的关系。其中,实体是指客观世界的具体事物;概念是指人类对于客观事物的概念化描述表示;事件是指发生在客观世界的活动;而关系则指实体、概念、事件之间客观存在的关联。知识图谱的核心优势体现在对于实体、属性等客观世界事物的关联关系分析,包括显性关系与隐性关系识别,例如:挖掘潜在的患者治疗途径、发现具有成本效益的新材料、找到偷税漏税的欺诈公司等。实际上,知识图谱作为新兴AI知识建模形式,适用于各行业和垂直领域(表1)。在这里插入图片描述
很多领先的科技公司和金融解决方案提供商都已积极使用图技术来构建知识图谱,用以增强语义搜索,知识发现和推荐引擎。比如,通过构建并查询图2所示的电影知识图谱,我们可以了解到尔冬升导演最喜欢用的配角演员是秦沛,最喜欢拍的电影类型是剧情片和动作片。结合AI算法,并加上票房、影评等信息,我们可以推理出哪些演员是高票房、高口碑的影视CP。知识图谱也常用在推荐引擎中解决冷启动问题。例如:基于图2这张电影图谱,无需大量数据,我们就能为看过《烈火战车》和《中华战士》的用户推荐《癫佬正传》这部电影。

图2 电影知识图谱

图2 电影知识图谱

2. 智慧医疗

医疗是典型以多源异构数据为主的行业,数据融合在医疗应用场景中十分复杂。以新冠疫情为例,高效防疫极大的考验着政府及医疗机构在调度、配置、优化资源等方面的能力,这些能力意味着对大量多源数据进行高速有效的分析、处理和应用,并涉及到海量多源异构数据的结构梳理、关系梳理、关系融合。这给复杂的疫情分析和快速配置防控方案带来了巨大挑战,也催生了基于图分析技术的智慧医疗应用。

在疫情防控中,图技术可以起到至关重要的作用[3]。不同于传统的数据分析只关注独立的个体信号,图技术可以通过关联医院、患者身份、治疗要求、实验设备、治疗结果、医疗设备供应商等信息,发现各种活动流之间隐藏的依赖关系,给出最佳防疫政策。此外,图技术还能通过将社区、家庭以及不同社交/职业群体的人构建成各种直接/间接的人群关联图谱,分析疫情的蔓延情况以及基础设施、服务和支持系统的响应水平,为实时医疗系统指挥、危机/紧急事态管理、个人行迹及人流分析、快速定位与感染者接触过的人群、医疗资源管理等应用提供必要的技术支持。

在未来,随着根据病人的病情特征、电子病历、历史用药、药物成分、临床试验、保险情况等多维数据绘制出以病患为中心的认知图谱的建立,更加高效准确、准确的智能诊断以及更加经济便捷的共享医疗也将更加普遍。

3. 政务治理

政务治理是数据治理在政务行业的应用,解决政务数据归集、数据资源建设、数据共享、数据应用以及数据安全等各类问题。面对政务数据规模大、种类多、数据孤岛遍布等问题,如何让数据发挥价值成为最大的难点。而这些正是图技术发挥价值的场景。

图技术在政务治理领域的一个成功案例是芬兰的Turku City[4]。图尔库市通过一套POLE(People, Objects, Locations, Events)框架来组织城市生活中方方面面的人、物、地点、事件及其复杂关系。它既可以描述复杂的商业问题又能用来定义基础的数据组织形式,使得图尔库市可以将其分散的市民、建筑、天气、交通、传感器等数据连接起来,自下而上地构建一个高度灵活的城市知识图谱,并运用组件化的数据构建方案配合可重用的AI算法,搭建了一个N-bridges(多桥)平台。多桥平台建成后正以成倍地数量增加应用场景,这其中包括:资源调配分析、就业分析、预测性维护、交通流量优化、配送路线优化、能源利用优化、欺诈侦测等。基于多桥平台的数据产品平均生产周期比之前缩短了75%(平均八周减少到两周)。这是由于POLE知识图谱框架在数据发现、洞察力探索和可组合解决方案体系结构中提供了强大的功能和灵活性。自2019年10月1日启动以来,多桥平台已在八个月内通过12个业务场景为图尔库市创造了超过220万美元的收益。
图3 图技术赋能政务数据价值释放[4]

图3 图技术赋能政务数据价值释放[4]

值得一提的是,POLE框架在新冠防疫中也发挥了巨大的作用。为了高效防疫,全球各地政府需对大量多源数据进行快速分析、处理、应用,这极大地考验了政府在调度社会力量、医疗资源、分析人员关系、优化配置方案等方面的政务能力。图尔库市利用POLE框架,结合人口数据、城市设施数据以及移动通讯数据,运行图分析算法,成功发现感染热点,并及时设计了干预政策。同时,通过结合POLE图谱、城市街道网络及交通限速数据,图尔库市高效、安全、快速的实现了对城市里老人的食物、药品和其他补给的送达。

4. 供应链管理

图技术凭借寻找复杂关联数据中隐藏洞见的能力,以及对于快速更新事物的强适应性,使其在制造、零售等领域管理快速变化的库存及复杂动态的供应链关系变得十分得心应手。图分析在供应链计划(supply chain planning)——特别是风险评估和实时响应方面非常有效。它被用来识别大型组织中特别成功的运营单位,以分析可复制的成功模式。通过可视化处理,图分析还可以进行因果关系和依存关系分析,从而提高预测模型的透明度。沃尔沃、捷豹路虎等零售制造商,皆成功依靠图数据库实现了物流流程优化和供应链管理。

为了使供应和需求之间的关系清晰化,捷豹路虎搭建了专门为汽车生产服务的供求图[5](图3-1)。图技术将生产数据清晰地分层,将复杂的业务流程直观化。然后根据业务逻辑分析数据间的关系,能够推理出达到供需平衡的具体指标,从而实现合理生产。
图4-1 捷豹路虎双向供求图[5]

图4-1 捷豹路虎双向供求图[5]

同时,通过图分析可以识别出供应过度和未充分利用的供应商,通过平衡两者供需比也能实现供应链风险管控(图3-2)。图4-2 捷豹路虎供应链风控图[5]

图4-2 捷豹路虎供应链风控图[5]

案例显示,图技术从决策速度、商业价值、供应商风险管控等方面都为捷豹路虎带来了巨大效益(图3-3)[5]。图4-3 捷豹路虎应用图技术的成果[5]

图4-3 捷豹路虎应用图技术的成果[5]

5. 数据资产管理

随着企业的发展,企业拥有的数据资产只会越来越庞杂,如何加工利用数据,释放数据价值,实现企业的数字化转型,是各行业企业面临的重要课题。

通过图技术进行语义建模,以元数据为驱动增强数据集成,是企业未来数据资产管理理念“数据织布”(Data Fabric)的两个新兴且至关重要的技术组件。因为它们支持其他组件之间的连接,并使初始设计随着时间的推移而发展[6]。通过易懂的知识图谱体现企业数据和元数据的关联视图,在该知识图谱上执行连续分析,激活元数据以支持实时数据管理设计,这是基于图技术的数据资产管理与传统方法最大的区别。

图数据库在数据资产管理中的应用将会促进数据价值的提升,并提高企业数据资产配置效率。企业可以通过图数据库建立企业数据资产全景图,快速搜索定位,形成有效的数据应用,提高企业在当下智能分析市场中的竞争力。

6. 客户关系管理

近年来,图技术在高科技、金融服务公司以及大型工业制造的头部企业客户关系管理(CRM)场景中取得了富有成效的应用。图技术能够将信息(如“销售知识”)编码为数据及其标签的复杂关系网络,组成销售知识图谱,并利用算法推理来发现业务员常规极难发现的复杂洞见,在销售线索预测、销售对话以及线上交互型销售机器人等场景中有很好的应用。

图技术解决了所有卖家长期面临的问题:优化销售执行。通过建立并维护一个复杂的因果关系链条网,图技术可以帮助企业建立销售执行的基本准则,以及整个销售流程链的闭环反馈体系,从而不再需要仅靠依赖管理者的个人经验和直觉来优化企业销售绩效[7]。销售知识图谱还可以用来衡量买家对交易的参与度,既可以独立使用,也可替代现存的销售分析数据湖。虽然目前仅头部1%-5%的企业使用了图技术,但Gartner预期,这一创新将迅速发展,因为未来所有形式的销售技术都需具备图分析能力[7]。

在客户管理层面,图还可以丰富传统分析技术,在市场篮子、反欺诈、社交网络分析、客户身份、线上线下数据融合、客户群体划分、客户旅程、RFM分析等场景发挥重大作用[8]。

循”图”渐进,未来可期

图数据库技术正处于加速发展的阶段。Gartner的数据显示,截至2020年5月,通过图数据库完成的查询量,相比2019年增加了40%。Gartner预计,图技术的应用将以每年100%的速度持续增长,企业采用率将从2020年的4%增长到2023年的30%[7]。

我们期待,在巨大的商业发展前景面前,图数据库将为企业释放更多的数据资产价值。值得欣喜的是,一批先进的图技术公司已经将眼光放在这个方向,在金融、能源、零售、社交等领域源源不断的诞生尖端应用落地。

未来已来,随着技术和商业的纵深整合,图数据库技术必将成为未来企业数据资产管理中不可或缺的技术,成为新基建的重要组成部分,让我们拭目以待。

参考资料:

  1. Gartner. “Graph Steps Onto the Main Stage of Data and Analytics”, 2020.
  2. Gartner. “How to Build Knowledge Graphs That Enable AI-Driven Enterprise Applications”2020.
  3. Gartner. “COVID-19 Demands Urgent Use of Graph Data Management and Analytics”, 2020.
  4. Gartner. “Case Study: Data and Analytics Monetization with Knowledge Graphs and AI (Turku City Data)”, 2020.
  5. Gartner. “Case Study: Answering Critical Business Questions with Graph Analytics (Jaguar Land Rover)”, 2020.
  6. Gartner. “To Graph or Not to Graph? That Is Not the Question — You Will Graph”.
  7. Gartner. “Hype Cycle for CRM Sales Technology”, 2020.
  8. Gartner. “Emerging Technologies and Trends Impact Radar-Customer Analytics for Customer Experience”, 2020.

-END-

关于创邻科技想了解更多,您可访问 http://www.chuanglintech.cn/或致电400-882-6897进行咨询,我们将竭诚为您服务!原文来自【创邻科技】公众号,想了解更多图数据库相关知识请在微信搜索【创邻科技】关注该公众号!

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值