问答系统历史:基于模板的问答专家系统----->基于信息检索的问答----->基于社区的问答----->基于知识库的问答(受益于维基百科等)
问答形式分类:一问一答,交互式问答,阅读理解。
现有的成果: Wolfram Alpha;答题机器人:日本的‘多达一’高考答题机器人、863:基于大数据的类人智能关键技术与系统;
评测数据集:1.QALD,知识库问答测评。QALD的测评指标:准确率、召回率和F值
2.WebQuestions(5810个问题)
3.FREE917
基于深度学习的问答方法:基于分布式表示(DL)的知识库问答;LSTM、attentionModel、memory network。
问句与答案计算相似度
传统的问答方法:符号表示;基于关键词、逻辑表达式、文本蕴含推理。
问句短语:
wh—短语:who 、when、where、what、which、why、how
wh+名词(形容词,副词):which shool ,how long
问答质量评估原则:相关度、正确度、精炼度、完备度、简单度、合理度
答案评估:正确、错误,不完全
问答系统基本组件:数据预处理,问题分析,数据匹配,查询创建,排序,结果生成与返回
答案的处理:抽取、组合、摘要、推理
基于知识图谱的问答的基本需求:支持自然语言问句查询,支持多种问题方式,准确率覆盖率高&#x