1.任务理解
-
问答系统的范畴
-
问答系统的准确度取决于 Query 的方法不同
- 规则式
- 统计/机器学习分类模型 e.g. HMM, CRF
- 深度学习模型 e.g. LSTM, BERT
- 结合以上,取其所长 e.g. Bi-LSTM+CRF
-
问题拆解(Entity Extraction)结合意图类型辨识
2.问答系统
2.1 定义
问答系统外部的行为上来看,其与目前主流资讯检索技术有两点不同:首先是查询方式为完整而口语化的问句,再来则是其回传的为高精准度网页结果或明确的答案字串。
2.2 问题定义类型
问答系统的 input 是自然语言问句,为了有效控制研究变因,多会定制可接受的问题类型来限制研究范围。
- 彷真陈述问答(Factoid Question Answering):最基本的类型,此类系统根据答案语料所述资讯,取出一小段字串作为答案。由于答案的正确与否是根据答案语料的内容来决定,在现实生活中不一定为真,故称为彷真陈述问答。
- 清单问答(List Question Answering):系统把问答范围进一步缩小,限定在人、地、组织等明确的专有名词上。e.g.清单型问句:『请列举美国历届总统』
- 定义问答( Definition Question Answering):