导读:知识图谱工程实践仅仅是迈向智能的第一步。丰富的结构化知识很有用,但是如何将这些符号化的知识融合应用到计算框架中仍然是一大挑战。通过与各类自然语言处理算法或模型结合,由知识驱动的显式事实知识和隐式语言表征,集成语言知识,才能发挥认知智能的威力,推动常识理解和推理能力的进步。
下面我们将介绍知识图谱如何提升智能水平。
作者:王楠 赵宏宇 蔡月
来源:大数据DT(ID:hzdashuju)
01 语义匹配
语义匹配是搜索推荐、智能问答和辅助决策的基础。在没有知识图谱以前,文本匹配主要依靠字面匹配为主,通过数据库搜索来获取匹配结果。但这种做法存在两个问题,一方面是文本输入本身的局限性造成检索遗漏;另一方面,检索结果的评价缺少可解释性,排序受到质疑,因此往往无法搜到想要的结果。
知识图谱的出现有效解决了上述两个问题,一方面通过关键词扩展获得更多输入效果,另一方面通过实体链接或对齐、概念层匹配,从数据库中获得对输入结果的解释和说明,进一步扩展了输入。如果输入为句子文本,还可以结合角色标注获得语义理解效果。
知识图谱在语义匹配方面,在如图4-12所示的几个方面增强了智能性。
▲图4-12 知识图谱为语义匹配增强智能性
1. 关键词增强
先定义词的同义词、上下位词等词集合,当关键词被检索时,其他与该关键词相关的词也通过图搜索的方式被检索出来,用来扩展或约束搜索,更加全面、准确地查找自己需要的信息。
2. 实体链接(对齐)
对自然语言描述的问题进行语法和语义分析,进而将其转化成结构化形式的查询语句,在知识图谱中直接查询甚至命中答案,而非召回大量网页链接。比如搜索“茶圣的作品是什么?”,可以返回答案“茶经”。其中茶圣链接到了陆羽,再从陆羽的知识卡片中查到了作品名称茶经。
3. 概念匹配
基于建立的知识库,通过图形用户接口(可视化的本体概念树)或关键词提交查询,系统、快速、有效地检索出某个概念的所有实例。在图谱中搜索“机器人”,可查看与该概念有关系的实例(比如软体机器人、码垛机器人等),这是概念的下位词。
通过概念关系,也可以获得上下游链条中的概念,从而帮助我们细化知识选择,提高概念检索的范围。实现从网页链接向概念链接转变,支持按概念主题而不是字符串检索。以图形化方式向用户展示经过分类整理的结构化知识,从而使人们从人工过滤网页寻找答案的模式中解脱出来。
4. 句间关系匹配
句间关系匹配是对两个短语或者句子之间的关系进行分类,常见句间关系匹配如自然语言推理(Natural Language Inference, NLI)、语义相似度判断(Semantic Textual Similarity,STS)等。通过关系分类或预测,可以从句子级别计算语义匹配