2020.09.01
来源
知识图谱是谷歌推出的产品
类似,facebook提出的社交图谱
典型应用
1、查询理解(例:基于知识图谱的搜索引擎)
2、自动问答
3、文档表示
主要技术
1、实体链接(entity linking)
两个任务:
- 实体识别(entity recognition):从文本中发现实体,如,人名
- 实体消歧(entity disambiguation):不同实体在不同文本中的不同概念
2、关系抽取(relation extraction)
关系抽取:抽取文本的实体关系(⚠️实体识别只是识别实体,这里除了实体还有关系,也就是一般呈现的三元组的形式)
关系抽取是知识图谱的关键技术,它决定了知识图谱中知识的规模和质量
3、知识推理(knowledge reasoning)
规则推理,新的关系推理
4、知识表示(knowledge representation)
知识图谱存在的问题:数据稀疏
有效解决这个问题的知识表示方法:低维向量
具体方法,以Trans-E为例说明,Trans-E是基于实体与关系的分布式向量表示方法,它将每个(h,r,t)中的r(relation)作为实体h(head)到实体t(tail)到翻译,不断的调整h,r,t,使得(h+r)=t;这里的h,r,t均为向量;
使用这种方式的好处:
1、缓解基于网络表示的稀疏问题
2、通过欧式距离or余弦向量等,容易计算实体间、关系间的相关度,可以寻找相似实体
3、可用于关系抽取,典型任务:知识补全(knowledge graph completion)
4、可用于发现关系间的推理规则
推荐读物:
中科院自动化所赵军团队2018年出版的教课书《知识图谱》
参考
-
《大数据智能-数据驱动的自然语言处理技术》刘知远 等 编著
-
https://tech.sina.cn/2020-03-16/detail-iimxyqwa0896689.d.html