目录
上次给大家介绍了GraphAcademy里面向数据科学家、数据工作者的课程《Neo4j 图数据科学简介》,从那里我们了解了Neo4j GDS的基本概念、安装和启用,以及图投影的具体操作。
今天给大家介绍后续课程《Neo4j 图数据科学基础》,我们详细看一下Neo4j GDS提供的图算法和它们适用的场景,以及图机器学习的基本用法。
希望通过本文的阅读可以了解课程内容,强烈推荐注册课程开始你自己的学习和进行实际编码和测试。
什么是 GraphAcademy
Neo4j GraphAcademy 是 Neo4j 推出的在线互动学习平台,提供免费、自由掌握进度的在线动手实验培训课程。不管你是开发者、运维管理员,还是数据科学家或从事机器学习、人工智能相关工作的人员,都可以在 GraphAcademy 找到适合你的课程。
所有课程均由具有多年经验的 Neo4j 专业人士开发。我们的目标是为你提供令人愉快的实践培训,其中包含文本内容、视频和代码挑战。
你通过的每门课程都会解锁一个徽章,可以通过你的职业档案或社交网络与朋友和同事分享。通过完成 Neo4j 认证考试,你将解锁限量版的 Neo4j T 恤奖励,以及更重要的是,获得图技术专业技术的证明,可以向雇主和同事展示这一荣誉。
《Neo4j 图数据科学基础》课程一览
在本课程中,我们将介绍数据科学家在使用 Neo4j 图形数据科学库 (GDS) 进行分析时需要了解的高级概念,课程涵盖了 GDS 中可用的图算法和机器学习操作的内容,并举例说明了如何在真实数据上使用它们。该课程继续使用运行在 Neo4j 沙箱的movie recommendations
数据集,你将在整个课程中使用它。
本课程需要你具备一些基础的图数据科学知识和图数据库知识。如果没有完成《Neo4j 图数据科学简介》课程,建议先完成后再进行本课程的学习。
通过本课程你将掌握:
- 图算法的执行模式
- 不同类别的图算法和常见用例
- 如何在 GDS 中运行原生图机器学习管道
本课程分为两节内容,目录大纲如下:
图算法
- 算法层和执行模式
- 中心性和重要性
- 挑战:度中心性
- 寻找路径
- 挑战:找到最短路径
- 社区检测
- 节点嵌入
- 相似
图机器学习
- 机器学习概述
- 节点分类管道
- 链接预测
现在跟我一起看一看吧。
图算法
图算法产品级别和执行模式
我们从一段伪代码开始:
CALL gds[.<tier>].<algorithm>.<execution-mode>[.<estimate>](
graphName: STRING,
configuration: MAP
)
这段代码表示调用Neo4j GDS库,[]
表示可选,<>
表示可以选择不同的值。
图算法产品层级
tier
表示Neo4j GDS产品的不同级别:alpha、beta和正式版。
- Alpha:表示算法处于实验阶段,可用于测试和验证,但随着版本的更新可能会发生变更。需要指定
tier
的值为alpha
来调用Alpha版本的算法。 - Beta:表示算法经过了Alpha版本的验证,可以作为正式版的候选版本。需要指定
tier
为beta
来调用。 - 正式版(production-quality):即生产就绪版本,表示算法经过了稳定性和可扩展性测试,可以用在正式环境中。不指定
tier
的值就默认表示使用正式版。
执行模式
execution-mode
有4种,用来指定如何处理算法的结果:
stream
:将算法的结果作为记录流返回。stats
:返回汇总统计的单条记录,但不写入 Neo4j 数据库或修改任何数据。mutate
:将算法的结果写入内存中的图投影并返回汇总统计的单个记录。write
:将算法的结果写回 Neo4j 数据库并返回汇总统计的单个记录。
内存估计
estimate
表示用来估算执行某个算法需要的内存大小,由GDS提供的一个估算程序来计算。
接下来我们详细看一看Neo4j GDS 提供的算法,即