知识图谱系列-0【先看一个中文的知识图谱库-linked open schema】

本文介绍了东南大学构建的linked open schema中文知识库,包含数亿关系对和百万实体。通过相似关系检测和语义关系检测,利用标签和网页内容建立类别间的相关、子类和同等关系。知识库的构建过程涉及基于标签的类别相似度计算、相关概念集和向量的相似度计算,以及基于TF-IDF的类别信息表示。
摘要由CSDN通过智能技术生成

**

linked open schema【中文知识库】

**

论文链接 : On publishing Chinese Linked Open Schema


这是东南大学做的一个知识库,基于50多个中文网站数据,包含数亿个关系对,及百万个实体。整体流程如下图:

这里写图片描述


**

解决思路:

**

  1. 问题的输入:一堆网页,网页由类别及标签组成。其中类别以层次的方式组织,并且当作是静态类别;标签以平坦排列的方式组织,由于标签可能是被用户随意打上的,所以也当作是动态类别。</

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值