论文简介-1

论文

一、本体论在自动问答系统中的应用_骆正华

基于本体来组织问句的方法,并探讨在基础上分析问句的方法,并利用本体向量
来联系问句实例和领域知识,达到问题和答案的连接。
领域QA体系结构示意图
用户提交的问句

  1. 进行分词、 词性标注、 语块划分等浅层句法分析
  2. 在语块结构化的问句实例中找相似的问句

构造本体的目的都是为了实现某种程度的知识共享和重用。
领域知识可划分为三个层次,通用概念知识->领域概念知识->具体事实知识。

  1. 领域具体事实知识的表示

    • 采用XML标记规范,主题、操作事件或业务实体、描述或属性。
  2. 问句语义的表示

    • 主题、疑问块、问句语义表示

问句向量本质上有三种情况

  1. 主题+实体+属性
  2. 主题+事件+角色
  3. 向量是一组无序的关键字
二、一种基于加权语义相似度模型的自动问答系统_刘亚军
  1. 利用语义树中词语间的距离和语义树的高度来计算词语间的语义相似度
  2. 利用词语间的语义相似度和词语的权重进一步计算用户问题与答案库中问题间的语义相似度。

关键词语(权重高的词语)

三、自动问答系统中的问题理解研究_曹志娟

QA系统主要分为五个部分
问题理解、信息检索、信息处理、答案抽取、FAQ系统。
虚拟信息QA系统框架

主要是三个主要部分

  1. 问题理解
  2. 信息检索
  3. 答案抽取

讲述问题理解的两个关键点:问题分类和问句扩展。

  1. 问题分类

词法分析:问句分词和标注
问题分类:基于答案对象的类型分类,增加疑问词短语分类、问题标准型、特征词分类

1. 识别问句中的疑问词,根据疑问词找到句型模式集合
    - 人、地点、具体时间、持续事件、数量、原因、方法、其他
2. 与集合中的句型规则进行匹配,从而得到问题标准型
    - 通过形式语言制定具体规则
    - 通过概率分类的方法
3. 再根据特征词确定问题领域
    - 特征词的扩充
  1. 问句扩展

    1. 问句重写-更改为定制的模板
    2. 关键词扩展

      • 名词、动词的关键词
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值