问答系统调研

要构建一个自动问答系统,应从哪些方面入手?(来自知乎)

  • 机器学习里的分类算法。
  • 自然语言处理里的信息检索、信息抽取以及一些基础技术包括句法分析、命名实体识别等等。
  • 如果想做的更加智能,还可以应用人工智能的一些技术,比如知识推理等等。
    695653-20170312234249232-1970238924.png

大型QA系统大多数是基于Web信息检索的,各级NLP技术比如句法分析,NER,IR/IE等都会涉及。
还有一种是基于Knowledge Base的, 将自然问句形式化成Query,到知识库里检索答案。

如果想自己做一个简单系统的话可以先选择一个特定领域比如医疗QA,到网上抓取数据,用语义网RDF/OWL构建一个知识库,然后用开源NLP包分析问句,转换成查询语句去搜答案,最后返回给用户,在这个基础上自己可以深入做推理等其他高级功能。

开源问答系统(不是智能问答系统)

像常用类型的网站(比如博客系统、问答系统、维基系统)都有开源库。

  • OSQA基于django
  • zheye.org “者也”,模仿知乎,基于Ruby Rails
  • askbot基于django
  • Shapado shapado 是一个用 Ruby 开发的类似 stackoverflow 的问答网站软件,基于 Mongodb 开发。
  • 仿百度知道PHP问答系统 Tipask,是PHP Laravel问答系统
  • PHP问答系统 Question2Answer
  • CNProg 是一个面向中国程序员的开源技术问答社区。 一个介于论坛、博客、维基和Digg之间的社区系统,基于Python和Django开发。 具有透明、开放、全民管理的运作模式,让所有用户能够更加容易地寻求帮助,找到问题答案,解决实际的技术问题。
  • Anwsion 是一个类似知乎以问答为基础的完全开源的社交网络建站程序,基于 PHP+MYSQL 应用架构,它集合了问答,digg,wiki 等多个程序的优点,帮助用户轻松搭建专业的知识 库和在线问答社区。
  • LampCMS 是一款类似 Stack Overflow 的服务于开发人员的问答系统(Q&A program), 深度整合了Facebook,Twitter等的APIs
  • QuestionAnsweringSystem 基于Java的人机问答系统
  • Stacked 是一个用 ASP.NET 实现类似 StackOverFlow 网站功能的开源软件。
  • LampCMS 的后台数据库使用的是一款非常有名的开源的 NoSQL 数据库 MongoDB
  • OpenEphyra 是一个使用 Java 开发的模块化、可扩展的问答系统、安装简单。
  • VIF (virtual discussion forum) 是一个用 Java 开发的论坛软件,主要适合问答型的社区。VIF 提供一个发布的工作流和发帖Review机制以确保发帖人的内容质量。
  • Coordino 可让你创建一个问答系统,使用 PHP 开发。
  • Qwench:PHP开发,类似stackoverflow
  • WeCenter 是一个类似知乎以问答为基础的完全开源的社交网络建站程序,基于 PHP + MYSQL 应用架构,它集合了问答,digg,wiki 等多个程序的优点,帮助用户轻松搭建专业的知识 库和在线问答社区
  • NGQA 基于Java Web的问答系统。
  • tipask:Tipask是一款开放源码的PHP问答系统,基于Laravel框架开发,容易扩展,具有强大的负载能力和稳定性。
18 智能问答系统调研 智能问答系统调研全文共30页,当前为第1页。智能问答系统调研全文共30页,当前为第1页。 智能问答系统调研全文共30页,当前为第1页。 智能问答系统调研全文共30页,当前为第1页。 中文问答系统调研报告 目录 问答系统调研报告 1 1 问答系统的价值体现 3 1.1 市场应用价值 3 1.2 弥补了搜索引擎的不足 3 1.3 总结 3 2 问答系统的市场应用情况 4 3 问答系统整体框架 5 3.1 问答实现流程 5 3.2 问句分析模块 6 3.2.1中文分词 6 3.2.2关键词提取 9 3.2.3关键词扩展 11 3.2.4实体识别 11 3.2.5问句分类 13 3.3 信息检索模块 14 3.3.1模式匹配 14 3.3.2答案检索 14 3.3.3知识图谱 17 3.4答案抽取模块 22 智能问答系统调研全文共30页,当前为第2页。智能问答系统调研全文共30页,当前为第2页。3.4.1基于规则的方法 22 智能问答系统调研全文共30页,当前为第2页。 智能问答系统调研全文共30页,当前为第2页。 3.4.2基于统计的方法 23 4 问答系统的应用场景 25 4.1 任务型 25 4.2 问答型 25 4.3 语聊型 26 5 调研总结 27 智能问答系统调研全文共30页,当前为第3页。智能问答系统调研全文共30页,当前为第3页。1 问答系统的价值体现 智能问答系统调研全文共30页,当前为第3页。 智能问答系统调研全文共30页,当前为第3页。 市场应用价值 问答系统是智能人机交互的技术基础,智能人机交互通过拟人化的交互体验逐步在智能客服、任务助理、智能家居、智能硬件、互动聊天等领域发挥巨大的作用和价值。因此,各大公司都将智能聊天机器人作为未来的入口级别的应用在对待。 包括Google、Facebook、Microsoft、Amazon、Apple等互联公司相继推出了自己的智能私人助理和机器人平台。 1.2 产品技术价值 搜索引擎的缺陷: 一方面,用户所输入的搜索关键词或关键句,无法真实反映用户需求;另一方面,检索系统仅仅通过几个关键词的简单逻辑组合来返回答案。两方面的误差造成检索结果很差。 检索结果不够简洁。冗余信息使用户难以快速准确定位所需信息,造成时间和精力的浪费。 缺乏对用户问句的语义理解。只靠关键词的索引或简单的匹配算法,并不能真正触及到问题的真实意思,使检索结果一般。 问答系统能针对搜索引擎缺陷的改进 问答系统允许用户以自然语言的形式询问或者输入。 问答系统能直接返回答案,提供给用户简洁、有效的答案。 问答系统能分析用户意图,提供给用户真正有用、准确的信息。 1.3 总结 无论是在日常生活中查阅资料,还是在科学研究、商业金融等领域的应用,都有智能问答的参与,所以智能问答的发展与管理将是人们不可忽视的研究方向。 2 问答系统的市场应用情况 按照市场应用情况可分为五类:在线客服,娱乐机器人,教育聊天机器人,个人助理和智能问答. (1) 在线客服 智能问答系统调研全文共30页,当前为第4页。智能问答系统调研全文共30页,当前为第4页。在线客服聊天机器人系统的主要功能是和用户 行基本沟通并自动回复用户有关产品或服务的问题,降低企业客服运营成本,提升用户体验.应用场景通常为网站首页和手机终端,代表有小爱机器人,JIMI(JD)客服机器人,JIMI具有一定的拒识能力,即能够知道自己不能回答用户的哪些问题以及何时应转向人工客服. 智能问答系统调研全文共30页,当前为第4页。 智能问答系统调研全文共30页,当前为第4页。 (2) 娱乐 娱乐机器人主要同用户进行开放主题的对话,从而实现对用户的精神陪伴,情感慰藉和心理疏导等作用,主要针对社交媒体,儿童玩具,代表产品有微软小冰和腾讯的小微,小微除了能够与用户进行开放主题的聊天外,还能提供特定主题的服务,如天气预报和生活常识等. (3) 教育 教育聊天机器人根据教育内容构建交互的语言使用环境,帮助用户学习某种语言,在学习某项专业课程时,指导用户逐步深入学习并掌握技能,用户的特定年龄阶段,帮助用户进行某种知识的辅助学习等.通常该类聊天机器人具备交互学习功能,培训软件及智能玩具等,代表有科大讯飞开心熊宝系列玩具. (4) 个人助理 该类聊天机器人主要通过语音或文字与聊天机器人系统进行交互,实现个人事务的查询及代办,如天气查询,空气质量查询,定位,短信收发,日程提醒和智能搜索等,从而更便捷辅助用户的日常事务处理,代表有Apple的Siri,Google Now, Cortana. (5) 智能问答 智能应答的聊天机器人主要功能包括以自然语言形式提出的事实型问题和需要计算和逻辑推理型的问题,已达到满足用户的信息需求及辅助用户进行决策的目的.代表有IBM wats
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值