本体(Ontology)在问答系统(QA)中的应用

相似度计算

把本体作为工具,根据本体计算词语的语义相似度,进而得到句子的相似度。通过本体计算词语的相似度又主要分为两大类:
(1)常用词语用通用领域本体(如《知网》、wordnet等)计算词语的语义相似度;
(2)专业领域词语,用领域本体计算词语的语义相似度;
该种方法搭建问答系统的流程如下:
这里写图片描述
(1)利用分词工具自定义词典,分词以及词性标注;
(2)删除停用词,停用词对于句子的理解无意义,对问题的检索起不到作用;
(3)专业词汇采用基于领域本体的概念相似度方法计算词语语义相似度,其他词汇采用基于《知网》本体计算词语语义相似度;
(4)在词语语义相似度的基础上计算句子的相似度;
(5)根据用户所提问句与FAQ库中问题的句子相似度,定义一个相似度阈值,从FAQ库中抽取相似度阈值最高的问题的答案作为用户提问的问题答案;

利用本体的关系进行关键词扩展

根据本体中的关系(上下位关系、同义关系、相关关系)对用户问句识别出的关键词进行扩展,增大问题的检索范围,从而提高问答系统的查全率。
比如,在传统的基于模式匹配的FAQ问答系统中,将领域本体作为附加知识库,对用户问句经过分词处理之后,提取关键词,一面在FAQ中匹配答案,一面基于领域本体扩展关键词给出相关内容的推荐。
这里写图片描述

本体作为知识库

本体为问答系统提供了结构化、关联化的高质量数据,可以作为问答系统的知识来源。将用户输入的自然语言问句经过处理后,映射到本体的结构化查询上,从而给出更准确的信息,实现问什么答什么的智能问答。
这里写图片描述
比如,用户输入问句“How many people are there in kunming”,经过问句处理之后转化为结构化查询语句,在本体库中映射到“population”人口属性上,进而得到答案。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值