清华大学开源OpenKE：知识表示学习平台

最新推荐文章于 2024-06-24 17:02:20 发布

机器之心V

最新推荐文章于 2024-06-24 17:02:20 发布

阅读量1.2w

点赞数 13

文章标签：人工智能 c/c++ php

本文链接：https://blog.csdn.net/Uwr44UOuQcNsUQb60zk2/article/details/78447470

版权

OpenKE是THUNLP基于TensorFlow开发的知识表示学习平台，提供多种KRL方法的快速稳定工具包，支持GPU加速和C++部署。包含TransE, TransH, TransR等模型，并提供预训练嵌入。" 113716033,10553836,Bash中操作MySQL数据库：CSV格式的导入导出,"['数据库', 'MySQL', 'Bash']

摘要由CSDN通过智能技术生成

清华大学自然语言处理实验室近日发布了 OpenKE 平台，整合了 TransE、TransH、TransR、TransD、RESCAL、DistMult、HolE、ComplEx 等算法的统一接口高效实现，以及面向 WikiData 和 Freebase 预训练知识表示模型。该项目旨在为开发者与研究人员提供便利。

项目链接：http://openke.thunlp.org
GitHub：https://github.com/thunlp/OpenKE

OpenKE 是一个开源的知识表示学习平台，由 THUNLP 基于 TensorFlow 工具包开发。在 OpenKE 中，我们提供了快速和稳定的工具包，包括最流行的知识表示学习（knowledge representation learning，KRL）方法。该框架具有容易拓展和便于设计新的知识表示学习模型的特点。

该框架有如下特征：

拥有配置多种训练环境和经典模型的简易接口；
对高性能 GPU 训练进行加速和内存优化；
高效轻量级的 C++实现，用于快速部署和多线程加速；
现有大规模知识图谱的预训练嵌入，可用于多种相关任务；
长期维护以修复 bug，满足新需求。

基准测试

一些数据集如 FB15K、FB13、WN18 和 WN11 通常用于知识表示学习的基准测试。我们以 FB15K 和为 WN18 为例介绍我们的框架的输入文件的格式。

数据集有以下五种格式：

train.txt：训练文件，每行以 (e1, e2, rel) 格式书写，第一行是三元组的数量；
valid.txt：验证文件，和 train.txt 格式一样；
test.txt：测试文件，和 train.txt 格式一样；
entity.txt：所有的实体和对应的 id，每行一个实体及其 id；
relation2id.txt：所有的关系和对应的 id，每行一个关系及其 id。

还可以从以下地址下载原始数据：

FB15K、WN18：https://everest.hds.utc.fr/doku.php?id=en:tran

最低0.47元/天解锁文章

机器之心V

关注

13
点赞
踩
43

收藏

觉得还不错? 一键收藏
2
评论
清华大学开源OpenKE：知识表示学习平台

清华大学自然语言处理实验室近日发布了 OpenKE 平台，整合了 TransE、TransH、TransR、TransD、RESCAL、DistMult、HolE、ComplEx 等算法的统一接口高效实现，以及面向 WikiData 和 Freebase 预训练知识表示模型。该项目旨在为开发者与研究人员提供便利。项目链接：http://openke.thunlp.org GitHu
复制链接

扫一扫