自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 问答 (2)
  • 收藏
  • 关注

原创 2021-10-11

前不久我们又过了一个中国传统节日中秋节,在之前的文章里面我们介绍了中元节相关的一些鬼神的关系,那这次我们就看看中秋节又涉及到哪些人物的关系呢。中秋节,又称祭月节、月光诞、月夕、秋节、仲秋节、拜月节、月娘节、月亮节、团圆节等,是中国民间的传统节日。中秋节源自天象崇拜,由上古时代秋夕祭月演变而来。最初“祭月节”的节期是在干支历二十四节气“秋分”这天,后来才调至夏历(农历)八月十五,也有些地方将中秋节定在夏历八月十六——百度百科中秋与春节、清明、端午并称中国四大传统节日,围绕着中秋有着好些故事,比较出

2021-10-11 09:45:04 168

原创 图数据库在社交方向上的应用

图数据库在处理关联关系上具有完全的优势,特别是在我们这个社交网络得到极大发展的互联网时代。如果我们希望知道谁 LIKES(喜欢)谁(喜欢可以是单向或双向),也想知道谁是谁的 FRIEND_OF(朋友),谁是所有人的 LEADER_OF(领导)。通过搜索来查找,便需要耗费巨量的时间来一一对比,但通过图数据库的子图查询,则可以对这些各异的需求进行更精准的响应。子图查询最直接的优点就是对数据需求的表达能力很强。假设我们有一个查询需求:“查询小明的哪个朋友,既是小刚的领导,又喜欢小红”。已有的查询理解方

2021-09-16 10:22:35 317

原创 国足历届世界杯对战图关系

奥运会与世界杯,这两大顶级运动赛事交替着为我们的夏天带来激情与拼搏,许多男生看完一届奥运就会等着后年夏天的世界杯。但是突如其来的全球性疫情打乱了运动健儿们的脚步,2020年的东京奥运会推迟了一年,各项球类的联赛也被延期到了今年,所以今年运动员们的比赛安排就十分紧凑。20年东京奥运会刚结束一个月左右,就要开始进行22年世界杯的亚洲区预选赛的第三阶段(12强赛)。虽然在9月2号以及9月7号中国男足先后以3-0、0-1负于澳大利亚和日本,仍未取得12强赛首胜,但是我们还是可以抱有一些希望的,毕竟后面还有8场比

2021-09-16 10:06:11 336

原创 图计算的应用

医疗行业的应用图计算的出现使得对病人的智能诊断成为可能。对病人开具处方需要依据病人的病情特征与以往的健康情况,以及药物的相关情况。过去的医疗大多依赖于医生的个人经验与病人的自我描述,传统的数据处理系统无法一次性调出多个与病人情况、保险情况、药物情况相关的数据库——挑战在于信息必须由多个在线资源拼凑而成,包括列出疾病和治疗的电子病历、医疗保险或其他跟踪医疗服务的数据库、描述药物的数据库,在某些情况下,还有跟踪临床试验的独立数据库。从不同来源收集信息,然后分析信息,以揭示用其他方法发现不了的

2021-09-15 10:58:00 182

原创 图遍历算法

上一篇文章中我们简单介绍了什么是图和图分析,图分析的应用场景和优点,以及一些常用的图工具,这篇文章里将介绍一下简单的图遍历算法。图的遍历图的遍历是指,从给定图中任意指定的顶点(称为初始点)出发,按照某种搜索方法沿着图的边访问图中的所有顶点,使每个顶点仅被访问一次,这个过程称为图的遍历。图遍历算法主要分为两种:广度优先搜索和深度优先搜索。广度优先搜索广度优先搜索是从图的一个顶点开始,向外一层一层地搜索,优先访问所有相邻顶点,直至图中所有顶点都被访问到为止的搜索方法,如下图所示:图1

2021-09-15 10:31:52 520

原创 GraphScope、Neo4j与TigerGraph单机环境下性能对比

目前工业界和学术界已经开发出了很多图分析系统,针对图分析的计算特性提出了各种各样的优化策略,在图分析任务上取得了优异的性能。近年来,各种各样的图数据库支持了各种查询语言(例如Cypher、GSQL和Gremlin),尝试为用户提供简单易用的图查询功能,利用这些查询语言,用户也可以表达出SSSP、PageRank等图分析算法的计算逻辑。为了对比图分析系统和图数据库在图分析任务上的性能,我们选取了典型的图分析系统GraphScope和图数据库系统Neo4j以及TigerGraph,在单机环境下进行了性能对比。

2021-09-03 18:09:04 1704 1

原创 GraphScope、Gemini与GraphX的性能对比

目前图计算系统主要分为两大流派,generalpurpose和graph-specific。Generalpurpose系统底层基于RDD等通用数据抽象,基于通用大数据平台(如Spark)将图计算操作转换为retationaloperator等通用操作,而graph-specific系统将数据直接表示成图结构,并为用户提供访问、操作点、边的图结构等接口。为了比较generalpurpose和graph-specific图计算系统在图分析任务上的计算效率,我在阿里云拉起了配置为16核CPU,248G...

2021-09-03 18:00:22 1522

原创 NetworkX与GraphScope的性能对比

近年来,全球大数据进入加速发展时期,数据量呈现指数级爆发式增长,而这些大量数据中不同个体间交互产生的数据以图的形式表现,如何高效地处理这些图数据成为了业界及其关心的问题。很过用普通关系数据无法跑出来的结果,用图数据进行关联分析会显得异常高效。提到处理图数据,我们首先想到NetworkX,这是网络计算上常用的Python包,可提供灵活的图构建、分析功能。但是我们使用NetworkX跑大规模图数据时,不仅经常碰到内存不足的问题,而且分析速度很慢,究其原因,是NetworkX只支持单机运行。通过网上搜索,新发

2021-09-02 18:15:16 1767

原创 奥运神颜运动员

提到奥运会,大家首先会想到年轻、热血、匀称、强悍。随着祖国的经济发展稳步向前,累积30多年快速发展的雄厚物质基础,再加上独步全球的强大疫情应急处理能力,当代的年轻人相对于年轻时的父辈,早已不再将奥运金牌得数作为祖国强大与否的证明,而是更加关注运动员个人价值的表达——努力仍然是最重要的评估因素,但与此同时,有趣、有颜、有想法,拥有这些品质的运动员,能得到大众更多的欣赏与偏爱。那么本期,小编就来总结一下,开幕至今(2021年7月26日),在微博被“钦点”过“神颜”的女运动员吧!小编绘制了如上

2021-07-31 22:18:28 123

原创 图分析入门

1.什么是图近几年,全球大数据进入了加速发展时期,数据量呈指数级增长。大数据中不同个体间的关联关系产生的数据以图的形式呈现。这里的图是针对数学中的“图论”而言,主要是由点和边组成的数据结构。顶点相当于树中的节点。顶点之间的关联关系,被称之为边。例如:坐在办公室的三个人,这三个人就是三个点。三个人之间的关系称之为边,如:同事关系,师妹关系,项目合作关系等等。2.什么是图分析图分析使用基于图的方法来分析连接的数据。我们可以:查询图数据,使用基本统计信息,可视化地探索图、展示图,或者将图信息预处理

2021-07-04 23:24:01 238 1

原创 分布式图计算引擎

最近在做一个图数据库系统的项目,接触到GraphScope,搜了下发现是阿里发布的分布式图处理框。之前没接触过,所以了解下,常见的还有NetworkX、CuGraph、GraphLab等等,国内大厂就有阿里的GraphScope,腾讯的Plato,字节的ByteGraph。字节这个与其他的OLAP不同它是属于OLTP,但也在朝OLAP发力。上面说的OLTP和OLAP,是指联机事务处理OLTP(on-line transaction processing)和联机分析处理OLAP(On-Line Analy

2021-06-30 10:21:47 384

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除