论文
一、本体论在自动问答系统中的应用_骆正华
基于本体来组织问句的方法,并探讨在基础上分析问句的方法,并利用本体向量
来联系问句实例和领域知识,达到问题和答案的连接。
用户提交的问句
- 进行分词、 词性标注、 语块划分等浅层句法分析
- 在语块结构化的问句实例中找相似的问句
构造本体的目的都是为了实现某种程度的知识共享和重用。
领域知识可划分为三个层次,通用概念知识->领域概念知识->具体事实知识。
-
领域具体事实知识的表示
- 采用XML标记规范,主题、操作事件或业务实体、描述或属性。
-
问句语义的表示
- 主题、疑问块、问句语义表示
问句向量本质上有三种情况
- 主题+实体+属性
- 主题+事件+角色
- 向量是一组无序的关键字
二、一种基于加权语义相似度模型的自动问答系统_刘亚军
- 利用语义树中词语间的距离和语义树的高度来计算词语间的语义相似度
- 利用词语间的语义相似度和词语的权重进一步计算用户问题与答案库中问题间的语义相似度。
关键词语(权重高的词语)
三、自动问答系统中的问题理解研究_曹志娟
QA系统主要分为五个部分
问题理解、信息检索、信息处理、答案抽取、FAQ系统。
主要是三个主要部分
- 问题理解
- 信息检索
- 答案抽取
讲述问题理解的两个关键点:问题分类和问句扩展。
- 问题分类
词法分析:问句分词和标注
问题分类:基于答案对象的类型分类,增加疑问词短语分类、问题标准型、特征词分类
1. 识别问句中的疑问词,根据疑问词找到句型模式集合
- 人、地点、具体时间、持续事件、数量、原因、方法、其他
2. 与集合中的句型规则进行匹配,从而得到问题标准型
- 通过形式语言制定具体规则
- 通过概率分类的方法
3. 再根据特征词确定问题领域
- 特征词的扩充
-
问句扩展
- 问句重写-更改为定制的模板
-
关键词扩展
- 名词、动词的关键词