TorchDrug教程--知识图推理

发呆的比目鱼

已于 2022-12-07 20:03:55 修改

阅读量815

点赞数

分类专栏： DrugAi 文章标签：人工智能

于 2022-09-25 16:05:45 首次发布

本文链接：https://blog.csdn.net/weixin_42486623/article/details/127039167

版权

DrugAi 专栏收录该内容

186 篇文章 196 订阅

订阅专栏

TorchDrug教程–知识图推理

教程来源TorchDrug开源

神经归纳逻辑编程的一种流行方法是NeuralLP。NeuralLP考虑到最大长度的所有链式规则(例如，nationality = born_in + city_of)。此外，还使用注意机制为每个逻辑规则分配标量权重。在训练过程中，对注意力模块进行训练，这样我们就可以学习到每个规则的合适权重。在测试期间，逻辑规则及其权重一起使用来预测缺失的链接。

接下来，我们将介绍如何部署一个用于知识图推理的NeuralLP模型。

准备数据集

我们从加载数据集开始。与知识图嵌入教程类似，使用FB15k-237数据集进行说明。我们可以通过运行以下命令来加载数据集

import torch
from torchdrug import core, datasets, tasks, models

dataset = datasets.FB15k237("~/kg-datasets/")
train_set, valid_set, test_set = dataset.split()

定义我们的模型

然后，我们现在可以用以下代码定义NeuralLP模型

model = models.NeuralLP(num_relation=dataset.num_relation,
                        hidden_dim=128,
                        num_step=3,
                        num_lstm_layer=2)

这里hidden dim是NeuralLP中使用的实体和关系嵌入的维数。num_step是链式规则的最大长度(即链式规则主体中关系的最大数量)，通常设置为3。num_lstm_layer是NeuralLP中使用的lstm层数。

一旦我们定义了模型，我们就可以开始定义任务了。由于训练NeuralLP与训练知识图嵌入思想相似，我们也使用了下面的知识图嵌入任务

task = tasks.KnowledgeGraphCompletion(model, fact_ratio=0.75,
                                      num_negative=256,
                                      sample_weight=False)

不同之处在于，我们需要指定fact_ratio，它告诉代码有多少事实被用于构建我们执行推理的背景知识图，这个超参数通常设置为0.75。

Train and Test

对于我们已经定义的模型和任务，我们不能执行模型训练和测试。模型训练类似于知识图嵌入模型，其中我们需要创建一个优化器，并通过运行以下代码将每个组件提供给Engine实例

optimizer = torch.optim.Adam(task.parameters(), lr=1.0e-3)
solver = core.Engine(task, train_set, valid_set, test_set, optimizer,
                     gpus=[0, 1, 2, 3], batch_size=64)
solver.train(num_epoch=10)