学长让我了解一下这方面的知识,所以就写在这里当做笔记吧!
(揭开知识库问答KB-QA的面纱1·简介篇 - Losin的文章 - 知乎 https://zhuanlan.zhihu.com/p/25735572)资料来源
1.知识库,如维基等,但这些百科全书的知识组建形式是非结构化的自然语言
2.为了方便计算机的处理和理解,我们需要更加形式化、简洁化的方式去表示知识,那就是三元组(triple)
这里我们可以简单的把三元组理解为 (实体entity,实体关系relation,实体entity)
实体关系也可分为两种,一种是属性property,一种是关系relation。属性和关系的最大区别在于,属性所在的三元组对应的两个实体,常常是一个topic和一个字符串,如属性Type/Gender,对应的三元组(Justin Bieber, Type, Person),而关系所在的三元组所对应的两个实体,常常是两个topic
KBQA的特点:
1.回答的答案是知识库中的实体或实体关系
2.评价标准:回召率 (Recall),精确率 (Precision) ,而比如对话系统则人工评价或者BLEU((Bilingual evaluation understudy)是用来评价翻译质量的一个指标)
实现KBQA的一些方法:
1.语义解析(Semantic Parsing):该方法是一种偏linguistic的方法,主体思想是将自然语言转化为一系列形式化的逻辑形式(logic form),通过对逻辑形式进行自底向上的解析,得到一种可以表达整个问题语义的逻辑形式,通过相应的查询语句(类似lambda-Caculus)在知识库中进行查询,从而得出答案。
2.信息抽取
3.向量建模
知识补充:
1.什么是freebase:
Freebase was a large collaborative knowledge base consisting of data composed mainly by its community members. It was an online collection of structured data harvested from many sources, including individual, user-submitted wiki contributions
2.什么是baseline与benchmark
baseline大家的说法虽有差别,但大概是指某次实验中你用了很多不同的测例,这些测例或者说测例的结果可以叫做baseline(含有比较的意思,最低限度),benchmark就众说纷纭。有人说是“一个过程,包含setting,execution,analysis”,也有人说是想达到的目标。英语词典benchmark也是“用基准测试”的意思。有点迷。
好了,这篇就到这里了。下面会带来我读论文的一些笔记。