导读:图数据库的技术的根本是图计算与存储技术(事实上所有IT技术在本质上都是计算、存储与网络,因为计算有网络计算、分布式计算,存储有分布式存储、网络存储,因此我们经常省略掉网络而只说计算和存储),而图计算 (图分析)的理论基础是图论。
本文将通过回顾图论相关学科与技术的发展历史以帮助大家更好地了解图技术。
(三)浅谈拓扑概念
欧拉解决了七桥问题之后又过了110年,另一位德国数学家利斯汀(Johann B. Listing 1808-1882)在1847年率先提出了拓扑(topology)的概念。
拓扑学研究的范畴包括例如维数、连通性、紧致性等。例如对莫比乌斯带(Mobius Strip)的研究,莫比乌斯带在日常生活中有广泛的应用,比如动力机械的皮带就做成“莫比乌斯带”状,这样皮带就不会只磨损其一面。它还有很多神奇的特性,如果从中间剪开一个莫比乌斯带,不会得到两个窄的带子,而是会形成一个旋转了两次再结合的环。
如果你把带子的宽度进行三分,并沿着分割线剪开的话,会得到两个环,一个是窄一些的莫比乌斯带,另一个则是旋转了两次再结合的环。
(四)从图到随机图理论的研究
“图”(Graph)这个概念被单独提出是在1878年,英国数学家西尔维斯特(J.J. Sylvester)在《自然》(Nature)上发表的一篇论文中首次提出图(Graph)的概念:
一张图由一些顶点(实体)和连接这些顶点的边(关系)组成。
读者对于西尔维斯特1850年“发明”的另一个名词—矩阵(Matrix)则绝不会感到陌生。
20世纪60年代左右,匈牙利数学家厄多斯(Erds)和R瑞利(Rényi)建立了随机图理论(Random Graph Theory),在数学上开创了随机图理论的系统性研究。在随后的40多年里,随机图理论也一直是研究复杂网络的基本理论。
到了二十世纪90年代初,互联网之父Tim B. Lee提出了语义互联网络(semantic web)的概念,也就是说把整个WWW上的所有页面都看作是一个巨大网络中的资源节点,而这些节点间是相互关联的。这个把互联网资源图论化的设想催生了W3C的RDF(资源描述框架)标准的推出,被视作图计算的鼻祖。只不过相比于学术气息浓郁的RDF而言,LPG(标签属性图)对于图中顶点与关系的描述更为简单高效。
语义网络虽然具有相当的学术的高度,但在工业界并没有获得巨大的成功,倒是催生了互联网搜索引擎的巨头,先是90年代中后期如日中天的Yahoo!,随后是基于PageRank算法(一种高度并发的浅层的图算法)的谷歌公司的一枝独秀。
再之后就是基于社交图计算(social graph)而构建起来的社交平台Facebook,可以毫不夸张地说,Facebook的社交图计算的理念核心就是6度分隔理论,也就是说世间任意两个人之间的关联关系不会超过6步——该理念在社交网络的蓬勃发展中至关重要,Twitter、微博、微信、LinkedIn(领英)、EBay、Paypal可以说都是或多或少依托这个理念构建而成的。【点击链接,扩展阅读】图数据结构的进化_Ultipa的博客-CSDN博客你发现了吗?从交通路网、电话交换网到社交网络、电网、金融网络……在我们的生活和工作场景中,用“图”来诠释,远比其他形式更为直观、易用,表达更为立体、充分。图:路网交通(来源网络)电话交换网络(来源网络)社交网络(来源网络)你知道吗?如今许多赫赫有名的国际巨头公司,其“起家”的秘密即源于图技术,比如,facebook、Google 、推特、领英、贝宝……·facebook很多人听过大名鼎鼎的“六度分隔理论”——任意两个人之间,只要通过5或6个人就可以建立联系。脸书的技术.https://blog.csdn.net/Ultipa/article/details/113980413?spm=1001.2014.3001.5501
—— 未完待续 ——
通过本文的背景介绍,希望读者能够做好准备,更好地进入图数据库的世界。
图计算发展简史之完整目录:
一.图计算溯源
二.图论的早期应用场景
三.浅谈拓扑
四.从图到随机图理论的研究
五.关系型数据库和非关系型数据库
六.图计算与后关系型数据库时代
本文摘编于《图数据库原理、架构与应用》,经出版方授权发布。(书号:9787111708100)转载请保留文章来源。
◆内容简介:
这是一本能帮助读者快速掌握图数据库的原理、架构、算法、扩展、规划、测评、优化以及实战应用的著作,书中的理论和实践均来自国内领先的图数据库企业Ultipa的科研成果和实践经验,由Ultipa的创始人兼CTO孙宇熙领衔撰写。
该书内容全面、体系完整、循序渐进、深入浅出、图文并茂,兼具理论性、实战性、趣味性。用通俗的语言将抽象的图数据库技术具体化、形象化,将带领读者经历一次非凡的“图数据之旅”。
通过本书,你将掌握以下内容:
·图数据库、图计算的概念与区别;
· 图计算、图存储、图查询语言的原理;
· 高性能图存储架构、计算架构;
·图数据库查询与分析框架的设计;
· 度计算、中心性计算、相似度计算、连通性计算等图算法;
· 可扩展的图数据库设计;
· 高可用分布式设计;
· 图数据库在决策智能、反欺诈、反洗钱、智能推荐、流动性风险管理等多个领域的实战经验; · 图系统的规划、评测与优化。
◆作者简介:
孙宇熙:业界知名的高性能计算与存储系统专家、大数据专家、数据库专家及学者,Ultipa创始人兼CTO。曾任EMC(易安信)亚太研发集团CTO和中国研究院院长、哈尔滨工业大学客座教授、中国电子学会云计算专家委员会委员;持有50多个美国及中国专利;文物鉴赏家、收藏家,哈佛大学美术馆亚洲艺术鉴赏委员会理事;技术作家,著有《云计算与大数据》《软件定义数据中心》《大数据分析》《程序员生存手册》(The 99 Points of Launching High-Tech Business)等多部中英文科技畅销书。
嬴图(Ultipa)团队 一支致力于构建世界上最快、最直观、最易用的下一代实时图数据库的国际化的技术研发与推广团队。自研的核心产品包括高性能图计算与实时图数据库软件,已构建了一整套针对数据资产管理、数据生命周期管理、数据治理指标管理的智能化产品矩阵。团队目前已获得高密度并行图计算、超级节点处理、高性能查询语言及半结构化图数据处理、海量数据导入、装置、设备及存储介质、数据库深度路径搜索、动态图剪枝过滤等30多项技术成果和专利,100%自研并拥有全部底层架构,研发成果已成功服务于多家大型央企、国有企业及世界500强企业。