技术动态 | 清华大学开源OpenKE:知识表示学习平台

清华大学自然语言处理实验室发布OpenKE,一个基于TensorFlow的知识表示学习平台,包含TransE等经典算法的高效实现,提供统一接口,支持预训练模型。OpenKE具有易用、高性能和长期维护等特点,适用于知识图谱研究与开发。
摘要由CSDN通过智能技术生成

本文转载自公众号机器之心,选自 THUNLP。                                                    



清华大学自然语言处理实验室近日发布了 OpenKE 平台,整合了 TransE、TransH、TransR、TransD、RESCAL、DistMult、HolE、ComplEx 等算法的统一接口高效实现,以及面向 WikiData 和 Freebase 预训练知识表示模型。该项目旨在为开发者与研究人员提供便利。


  • 项目链接:http://openke.thunlp.org

  • GitHub:https://github.com/thunlp/OpenKE


OpenKE 是一个开源的知识表示学习平台,由 THUNLP 基于 TensorFlow 工具包开发。在 OpenKE 中,我们提供了快速和稳定的工具包,包括最流行的知识表示学习(knowledge representation learning,KRL)方法。该框架具有容易拓展和便于设计新的知识表示学习模型的特点。


该框架有如下特征:


  • 拥有配置多种训练环境和经典模型的简易接口;

  • 对高性能 GPU 训练进行加速和内存优化;

  • 高效轻量级的 C++实现,用于快速部署和多线程加速;

  • 现有大规模知识图谱的预训练嵌入,可用于多种相关任务;

  • 长期维护以修复 bug,满足新需求。


基准测试


一些数据集如 FB15K、FB13、WN18 和 WN11 通常用于知识表示学习的基准测试。我们以 FB15K 和为 WN18 为例介绍我们的框架的输入文件的格式。


数据集有以下五种格式:


  • train.txt:训练文件,每行以 (e1, e2, rel) 格式书写,第一行是三元组的数量;

  • valid.txt:验证文件,和 train.txt 格式一样;

  • test.txt:测试文件,和 train.txt 格式一样;

  • entity.txt:所有的实体和对应的 id,每行一个实体及其 id;

  • relation2id.txt:所有的关系和对应的 id,每行一个关系及其 id。


还可以从以下地址下载原始数据:


FB15K、WN18:https://everest.hds.utc.fr/doku.php?id=en:transe

相关论文:Translating Embeddings for Modeling Multi-relational Data(2013)


FB13、WN11:http://cs.stanford.edu/~danqi/data/nips13-dataset.tar.bz2

相关论文:Reasoning With Neural Tensor Networks for Knowledge Base Completion


工具包


我们提供了多个知识表示学习的工具包,包括以下四个资源库:


OpenKE


这是一个基于 TensorFlow 的知识表示学习(KRL)的高效实现。我们使用 C++实现了一些基础操作,如数据预处理和负采样。每一个特定的模型都用 TensorFlow 和 Python 接口实现,因此能方便地在 GPU 上运行模型。


OpenKE 提供了训练和测试多种 KRL 模型的简易接口,无需在冗余数据处理和内存控制上花费太多功夫。OpenKE 实现了一些经典和高效的模型用于支持知识表示学习,这些模型包括:


  • TransE

http://papers.nips.cc/paper/5071-translating-embeddings-for-modeling-multi-relational-data.pdf


  • TransH

https://www.aaai.org/ocs/index.php/AAAI/AAAI14/paper/viewFile/8531/8546


  • TransR

https://www.aaai.org/ocs/index.php/AAAI/AAAI15/paper/viewFile/9571/9523/


  • TransD

http://anthology.aclweb.org/P/P15/P15-1067.pdf


  • RESCAL

http://www.icml-2011.org/papers/438_icmlpaper.pdf


  • DistMult

https://arxiv.org/pdf/1412.6575.pdf


  • HolE

https://www.aaai.org/ocs/index.php/AAAI/AAAI16/paper/viewFile/12484/11828


  • ComplEx

http://proceedings.mlr.press/v4

  • 1
    点赞
  • 16
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值