看“图”说话——你的“图”何时就位?

在这里插入图片描述

【导语】

用图还是不用图?这不是问题——你终将用图。

“图”能提高数据分析的视觉效果,提供更好的界面交互体验;“图”能提高数据资产利用率,缩短价值实现周期;“图”还能助力众多分析工具,成为高级应用的底层技术支撑。在这个万物皆“图”的时代,你的图技术是否已经就位?

近年来,图技术方兴未艾,迎来飞速发展态势。Gartner预计,图技术的应用将以每年100%的速度持续增长,从2020年的4%增长到2023年的30%。面对该趋势,企业又该如何把握时机,让“图”成为赋能利器,而不是人云亦云,亦步亦趋?

图技术释放数据资产价值

图技术已经存在数十年之久,但近几年却如异军突起,突然火爆,这种趋势背后的真正推手是什么?是传统技术不适用,还是环境变了,业务需求提高了?其实,“图”的重要性一直是不争的事实。名侦探在白板上画“图”,按图索骥,在众多零散的信息中找到有效线索。和“表”相比,“图”能更直观反映现实生活中的人、事、物以及他们之间的关系。在“图”的帮助下,我们能充分利用现有资源,轻松找到曾经极难挖掘的事实,或意外收获“未知的未知信息(unknown unknowns)”。

图技术既然这么好用,为什么近几年才开始崭露头角,登上数据分析的中心舞台?

因为“巧妇难为无米之炊”,“图”虽然价值巨大,但其对数据处理和管理方面的能力要求同样极高。图的存储计算极其消耗资源,传统系统根本无法处理。举个例子,对于10个关联实体,传统关系型方式通常用既定的树结构或层级结构为其搭建表示方式,如此一来,我们得到的最大关联数量为9;但如果采用图结构,我们可探索的最大关联数量为10的阶乘(即3,628,800)。因此,即使是小数据也能迅速以指数速度快速膨胀,更不用谈大数据。直至近年来,原生分布式图技术的发展以及便宜的弹性计算资源的普及才使广泛的图分析成为可能。

图分析的价值在于以多视角的方式充分挖掘关联数据,释放关联数据潜能,通过“关联度(connectedness)”判断图中所有节点的相互影响力、互动频率以及形成集群的可能性,从而找到复杂数据中深藏的洞见。图分析有出色的风险评估和响应能力,能助力欺诈监测、路线优化、分群、异常检测、马尔可夫链、离散事件仿真等应用。随着人工智能和机器学习的不断发展,“图”俨然已成为支撑众多高级应用(如虚拟个人助手、智能顾问等)必不可少的技术。

六大图分析方法各显神通

虽然图技术有众多应用价值,但它并不是“万灵药”,不能包治百病。企业在试水图技术前还需明确自身业务需求和痛点所在,理解图技术的赋能点,只有这样,我们才能对症下药,切实解决问题。

和传统技术相比,图技术最大的价值在于对事物间“联系”的挖掘和处理能力。所以,当业务问题涉及人、事、物之间的联系时,“图”往往会成为企业的不二之选。拿我们熟悉的零售场景来说,图技术能回答下列问题:

货物补给:如何在最短的时间内用最少的配送完成货物补给?

产品促销:如果将A产品移至货架高处,对应的销售额会提高多少?

购物篮分析:哪些产品拥有同类客户群?

产品推荐:基于相似算法,哪些方式能促成最优营销效果?

解决上述问题需要用到下述一类或多类图分析方法,这六大类分析方法涵盖的图算法数量可达上百种:

路径分析(Path analysis):查找图中两点间的最短路径。典型用例如路径优化,适用于物流、供应链管理和智慧交通等场景。

社区分析(Community analysis):分析网络疏密度,用于划分社交网络中互动密切的不同群体,可确定与目标营销群体相近的客户群。

联通性分析(Connectivity analysis):分析网络中各节点之间的连通性,可应用于电力领域,基于节点间的联通数量和路径受限与否,确定电力网络中的关键节点,分析网络存在的可能不足。

中心性分析(Centricity analysis):查找社交网络中的关键意见领袖,或查找访问量最高的网页。

链接预测分析(Link Prediction analysis):预测节点间未来的关联关系变化(形成联系或断开联系),可基于社交网络进行产品推荐。

相似度分析(Similarity analysis):基于实体联系和实体属性判断实体(即节点,表示人、物、地点等)之间的相似度,常用于相似产品/服务推荐或欺诈检测。在这里插入图片描述

图1 主要图分析类型

即使知道图分析的几大常见类型,我们对图的具体使用场景可能还是一知半解,也不清楚图技术在自身业务上的可行性。下面四条标准或许能帮助分辨图技术和自身业务需求的“对口程度”,确定图分析是否比传统分析方法更加适用:

业务问题:倘若问题描述中有“网络”、“树”、“分类”、“世系”、“层级”等词,说明在问题解决中“联系”比“事实(即数据)”本身更为重要。

大数据:高维或多源数据是数据集成面临的一大挑战,而图技术更易于处理这种复杂的关联数据。

路径优化问题:需要解决的业务问题需要基于特定因素(时间、距离等)求最优解。

联系:物体间的关联关系比物体本身(物体属性)更为重要。

表1所列为图分析的几个常见应用案例。

在这里插入图片描述

表1 图分析的常见应用场景

图分析与传统分析方法相辅相成

传统的数据存储方法极易丢失数据间的关联关系。虽然分析人员能通过SQL查询和join操作让这些联系“重见天日”,但随着数据规模和数据间的可能联系增加,查询复杂度随之提高,传统分析方法败下阵来。图分析可赋能传统分析方法,增强数据间已知复杂联系的查询和建模效率,助力数据间未知联系的探索、挖掘和分析能力。

对于图分析而言,数据间的关系同数据本身一样重要,因此图分析在数据和元数据挖掘能力上尤其出色——传统数据分析方法就给定的具体问题去寻找答案,从 “事实数据”中见“价值”;而图分析却能够挖掘那些“未知的未知(unknown unknowns)”,从“数据关系”中见“价值”。借助图分析进行模式挖掘,我们能发现多个数据集中的潜在模式,像拼图一样逐渐得到关于数据的“全局视角”,从而在全方位考量的基础上做出最佳商务决策。如图2,信用卡客户“张三”、“李四”从单个账户信息、以及支付、还款行为来看都很正常,满足提额条件。但通过图分析可视化呈现数据关系后,我们能发现“张三”和“李四”之间存在间接联系,有可能是欺诈团伙。在这里插入图片描述

图2 图分析助力传统数据分析

图可视化赋值商务智能和分析平台

图分析能提高现代商务智能和分析平台的数据挖掘能力。对已经完成的图分析,我们能通过图可视化工具,用不同的大小、颜色、形状和图标来灵活展示多类实体和实体关系。在图分析的加持下,我们还可通过因果关系和依赖性分析提高预测模型的透明度和准确性(见图3)。

现代分析方法、商务智能平台和图技术供应商都在不断丰富他们的可视化能力,以更好实现实体和实体间联系的可视化展现。专业的图可视化、图存储、图分析技术厂商的不断涌现为图分析提供了极大便利——企业在不迁移现有数据的前提下便能对结构化数据和非结构化数据进行图分析。此外,像云和GPU这样改良过的、可扩展的、更低成本技术选项的出现也推动着图分析和图数据库等加速成为首选解决方案。在这里插入图片描述

图3 图可视化工具示例(图源:创邻科技Galaxybase Studio)

【结语】

过去二十多年来,图技术在高级分析中扮演的角色也许不起眼,但这“不起眼”的图技术对高级分析的实现却至关重要。现在,随着数字平台和技术的进步,图技术能为数据科学、元数据管理和数据管理增效,成为未来数据分析必不可少的新基建。

也许,给你一个“图”,你也能改变世界呢~

-END-

原文来自【创邻科技】公众号

想了解更多图数据库相关知识请在微信搜索【创邻科技】关注该公众号!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值