1. 细粒度实体描述知识库EntityDescriptionKB
1.1 项目概述
EntityDescriptionKB,涵盖87万实体概念描述知识库,基于开放文本挖掘而成,格式为[实体/概念,描述体,置信度], 如[谷歌,全球最大互联网搜索企业,1.0]、[亚马逊,美国最大电商和云服务企业,1.0]
1.2 项目由来
当前细粒度的实体描述需求很大,尤其是在细粒度实体推荐上,以百科标签、概念的方法进行实体描述,过于抽象,丢失了大量的上下文信息。
因此,实体描述数据,可以以一个短句的方式来描述实体的丰富信息,能够拓宽当前实体相关知识的落地范围,例如:
一方面,可用于常识问答、隐藏推理逻辑挖掘、实体信息embedding等;
另一方面可为概念上下位知识图谱提供数据来源,拓展现有概念知识维度
1.3 数据介绍
通过标注训练实体描述抽取模型,基于开源非结构化文本进行抽取形成,格式为[实体/概念,描述体,置信度]
:
杨元庆,合格联想CEO,1.0
中国网,中国外文出