0.前言
随着万物互联时代的到来,数据的类型和数量呈现爆炸式增长,图数据库对于揭示数据之间的联系有着天然独到的优势,尤其针对错综复杂的社交、物流、金融风控行业,其优势更为明显,发展潜力巨大。
一、图模型
图模型是一种对图数据抽象表达的方式。
1.属性图模型:由顶点、边、属性构成
- 人物顶点“王家卫”,其属性包括“性别”为“男”,“职业”为“导演”等;
- 电影顶点“重庆森林”,其属性包括“上映日期”为“1994 年”,“类型”为“剧情”等;
- 边“执导”,从顶点“王家卫”指向“重庆森林”,边上属性为空。
这是一个简单的图模型,其它相关的数据都可以加入进来,如下:
2.RDF模型
RDF 全称为资源描述框架,基于XML 语法及XML Schema 的数据类型以便更为丰富地描述和表达网络资源的内容与结构,是一种三元组形式,描述实体与实体之间的关系。
上述属性图用RDF图表示如下
3.两种图模型之前的区别
二、图数据发展历史
三、图数据库的特点
- 图数据库是面向关联关系图数据的存储数据库, 在基于图的数据增加、 删除、查询、 修改等方面做了不同于其他数据库的设计。
- 在图数据的操作抽象上, 采用基于顶点的视角, 比如顶点通过其所有出边访问其邻接顶点, 这一类的操作也是图数据库系统设计的核心。
- 性能:在关联关系的处理上, 关系型数据库处理不可避免要用到表的 JOIN 操作,非常影响性能。 而图数据库则是类似指针直接跳转访问, 在典型查询上比关系数据库通常有 2 到 3 个数量级的性能优势。
- 兼容性:传统数据库在新表建立时,由于关联关系的存在,表的改动很大。对于图数据库,仅需添加新的顶点、 边、 属性, 设置为对应的类型即可。
- 直观性:图模型在表现数据之间关系的时候,更直观。
- 数据库横向对比:
四、图数据库的应用场景
图数据库的应用原理是查询和分析连接数据, 对海量数据建立关联, 并通过多样及快速的方法对数据进行分析与挖掘。 此外, 与其他类型数据库相比, 图数据库的操作更为便捷、 数据更加直观、 存储模式灵活、 应用场景丰富, 是未来处理复杂数据关系的技术趋势。
-
反欺诈
难点:当今的欺诈者的手段也越来越复杂和隐蔽, 他们会很耐心地, 长时间地通过伪造众多身份, 制造虚假交易来维护一个的欺诈网络, 伺机作案。反欺诈的挑战主要体现在数据量大, 数据分散, 无法做到实时分析。
解决方案: 利用图数据库技术可以将分散的数据建立联系, 高效地处理分析海量数据, 并及时反馈分析结果。
-
推荐引擎
难点:推荐引擎是电子商务平台在激烈竞争环境中的制胜法宝, 精准及时的推荐,需要将商品、 客户、 库存、 供应商、 物流和网络舆情等数据有效地关联在一起。
传统的推荐引擎是静态地针对孤立的历史数据进行离线分析, 数据往往滞后一天,无法做到精细地建模。
解决方案:
—使用图数据库整合多元数据,来自商品、客户、库存、供应链等
—深链接分析,可以完成深层次关联的遍历和查询
—实时响应
-
知识图谱
知识图谱最早由Google提出,其本质是一个图结构的语义网络,顶点是实体或者概念,边是概念之间的语义关系。
知识图谱获取信息并将其集中到一个本体中,本体可以是人、概念、组织等。可以提高搜索引擎基于语义的数据的查询结果。
和传统的基于关键词的搜索相比, 基于图的搜索(Graph-based Search) 的优势:
(1) 搜索结果更精准和更丰富;
(2) 搜索的速度更快, 更实时;
(3) 搜索体验像在进行语言交流, 更加智能。