Neo4j
文章平均质量分 96
Neo4j是一个高性能的,NOSQL图形数据库,它将结构化数据存储在网络上而不是表中。它是一个嵌入式的、基于磁盘的、具备完全的事务特性的Java持久化引擎,但是它将结构化数据存储在网络(从数学角度叫做图)上而不是表中。Neo4j也可以被看作是一个高性能的图引擎,该引擎具有成熟数据库的所有特性。
Sonhhxg_柒
Save your heart for someone who cares. #愿岁月清净 抬头遇见皆是柔情#
展开
-
【Neo4j】第 12 章:Neo4j at Scale
现在我们可以使用 Neo4j 和图算法来回答许多问题,是时候关注 Neo4j 如何管理不同大小的数据了。Neo4j 4.0 之前的版本已经能够处理大量数据(数十亿个节点和关系),仅受磁盘大小的限制。但是 Neo4j 4.0 通过引入(一种跨越多台机器的图的技术)克服了这些限制(几乎)。本章将介绍分片,包括分片定义和专门用于查询此类图的新 Cypher 语句。在最后一节中,我们将研究大图的 GDS 性能。让我们开始吧!技术要求。原创 2022-10-16 10:03:46 · 901 阅读 · 14 评论 -
【Neo4j】第 11 章 :在您的 Web 应用程序中使用 Neo4j
在本书中,我们学到了很多关于 Neo4j 功能的知识,包括图数据建模、Cypher 和使用 Graph Data Science Library 的链接预测。我们所做的几乎所有事情都需要编写 Cypher 查询来提取数据和/或将结果存储在 Neo4j 中。在本章中,我们将讨论如何在真实世界的 Web 应用程序中使用 Neo4j,使用 Python 和 Flask 框架或 React JavaScript 框架。本章还将让您有机会使用 GraphQL 来构建灵活的 Web API。让我们开始吧!原创 2022-10-15 10:13:18 · 1653 阅读 · 16 评论 -
【Neo4j】第 10 章:图嵌入 - 从图到矩阵
在本章中,我们将继续探索图分析的主题并解决最后一个难题:通过嵌入通过图进行特征学习。由于() 中使用的词嵌入,嵌入变得流行。在本章中,我们将首先讨论为什么嵌入很重要,并了解术语所涵盖的不同类型的分析。之后,我们将开始从许多基于图邻接矩阵的算法中学习嵌入算法,试图减小其大小。稍后,我们将通过发现神经网络如何帮助嵌入来继续我们的旅程。从词嵌入的例子开始,我们将学习skip-gram模型,并使用DeepWalk算法绘制平行图。()。技术要求本章中使用的代码可在 GitHub 上的上找到。原创 2022-10-15 10:12:56 · 1436 阅读 · 16 评论 -
【Neo4j】第 9 章:预测关系
图是数据表示的一种特定形式。在前面的章节中,我们学习了如何以无监督或半监督的方式从图中提取信息。我们探索了如何将这些信息用作经典机器学习模型的特征,其中节点是观察值。在本章中,我们将处理一种只有图才有可能解决的全新类型的问题:链接预测。在准确了解链接预测问题是什么以及如何将其应用于不同的案例之后,我们将了解 Graph Data Science 库中实现的功能,这可以帮助我们找到问题的解决方案。最后,我们将使用 Python 及其数据科学工具箱研究一个真实的示例应用程序问题。技术要求如果您使用的是。原创 2022-10-14 10:34:56 · 840 阅读 · 15 评论 -
【Neo4j】第 8 章:在机器学习中使用基于图的特征
在本章中,我们将利用您对图、图数据库以及可以从图结构中提取的不同类型的信息(节点重要性、社区和节点相似性)所学的知识,并学习如何将这些知识集成到机器中学习管道以根据数据进行预测。我们将从使用包含问卷信息的经典 CSV 文件开始,并以该数据为中心主题回顾数据科学项目的不同步骤。然后,我们将探讨如何将这些数据转换为图形,以及如何使用图形算法来表征该图形。最后,我们将学习如何使用 Python 和 Neo4j Python 驱动程序自动化图形处理。本章将涵盖以下主题:本章将使用以下工具:如果您使用的是Neo4j原创 2022-10-14 10:18:52 · 753 阅读 · 15 评论 -
【Neo4j】第 7 章:社区检测和相似性措施
现实世界的图既不是规则的也不是完全随机的网格。它们的边缘密度不均匀,因此我们最终找到了一些有趣的模式。中心性算法利用一些节点可以比其他节点拥有更多连接的事实来评估节点重要性(参见第 6 章,节点重要性)。在本章中,我们将发现一种新型算法,其目标是识别彼此高度连接的节点组并形成社区或集群。其中一些社区检测算法已经在 GDS 中实现:组件算法、标签传播算法和 Louvain 算法。 本章是我们使用 JavaScript 构建社区图形表示并发现 NEuler(由 Neo4j 开发的图形算法游乐场应用程序)的机会。原创 2022-10-13 13:46:03 · 1051 阅读 · 17 评论 -
【Neo4j】第 6 章:节点重要性
在本章中,我们将讨论节点重要性,也称为中心性算法. 正如您将发现的那样,基于给定图形和给定问题的重要性定义,已经开发了几种技术。我们将了解最著名的技术,从度中心性和 Google 使用的 PageRank 算法开始。对于后者,我们将通过一个示例实现并在一个简单的图表上运行它,以充分了解它的工作原理以及何时可以使用它。在发现其他类型的中心性算法(例如中介中心性)之后,我们将在本章结束时解释如何在欺诈检测的上下文中使用中心性算法。在此示例中,我们将首次使用 GDS 中提供的工具从 Cypher 创建投影图,以便原创 2022-10-13 13:45:50 · 1625 阅读 · 15 评论 -
【Neo4j】第 5 章:空间数据
路口和街道都具有空间属性。对于最短路径应用,我们需要Junction节点、LINKED_TO关系和每个路段的长度,存储在length每个关系的属性中。如果您使用浏览器打开完整的 HTML 文件,则在更新连接参数后,您应该会看到与上一节中复制的地图类似的地图。例如,具有 ID 的节点42459137(前面复制列表中的第一个)具有d3=40.7137811,并且检查键的定义,d3表示 y 或纬度。在我们现在要研究的第一个示例中,我们将使用与上一节相同的数据集创建一个点的空间层,代表纽约曼哈顿区的一些兴趣点。原创 2022-10-12 08:23:37 · 1463 阅读 · 17 评论 -
【Neo4j】第 4 章:图形数据科学Library and Path Finding
文章目录在本章中,我们将首次使用Graph Data Science ( GDS ) 库,它是 Neo4j 的 Graph Algorithm 库的继承者。在介绍了该库的主要原理之后,我们将了解寻路算法。之后,我们将使用Python 和 Java中的实现来了解它们是如何工作的。然后我们将学习如何使用这些算法的优化版本,在 GDS 插件中实现。我们将介绍Dijkstra 和 A* 最短路径算法,以及其他与路径相关的方法,例如旅行商问题和最小生成树。本章将涵盖以下主题:本章将使用以下工具:如果您使用的是Neo4原创 2022-10-12 08:23:23 · 457 阅读 · 15 评论 -
【Neo4j】第 3 章:使用 Pure Cypher 为您的业务赋能
本章详细描述了如何创建知识图谱,可以使用已经结构化的数据,例如 API 结果,也可以使用可以查询的现有知识图谱,例如 Wikidata。我们还了解了知识图谱的两个重要应用:基于图的搜索,谷歌用来向用户提供更准确结果的方法,以及推荐,这是当今电子商务的必要步骤。在本节中,我们将讨论不同的搜索方法,以了解基于图的搜索如何成为搜索引擎的一大改进。这个查询,使用 Cypher 词,将读取:从标识符为 Q2211 (Malmö) 的实体开始,遵循类型P17(国家) 的关系,并返回该关系结束时的实体。原创 2022-10-11 21:10:59 · 594 阅读 · 10 评论 -
【Neo4j】第 2 章:Cypher 查询语言
Cypher 是用于与 Neo4j 交互的语言。最初由 Neo4j 为 Neo4j 创建,它已作为 openCypher 开源,现在被其他图形数据库引擎使用,例如RedisGraph. 它也是() 协会的一部分,其目标是构建一种通用的图形数据库查询语言——就像 SQL 用于关系数据库一样。无论如何,了解如何查询图形数据库是一个很好的起点,因为它的视觉方面:节点和关系可以通过查看查询来快速识别。原创 2022-10-11 10:27:44 · 3458 阅读 · 10 评论 -
【Neo4j】第 1 章:图数据库
其中,Neo4j 是一个带有大型生态系统的数据库,包括数据库,还有构建 Web 应用程序的工具,例如 GRANDstack,以及在机器学习管道中使用图形数据的工具,以及图形数据科学图书馆。数据也有类似的问题:没有合适的容器,我们就无能为力,我们需要一个合适的容器,这不仅可以存储数据,还可以帮助解决我们遇到的问题。Euler 的推理(在右侧)是将 这个复杂的地理简化 为最 简单的绘图,就像您在上 一张图片右侧看到的那样, 因为每个岛屿内使用的路线是不相关的。根据节点之间连接的属性,图分为几类。原创 2022-10-10 16:26:05 · 935 阅读 · 10 评论