本文在是对问答系统的优化,加入答案类别进行优化
总体架构:
答案类别通过未标注的答案和已标注的问题分类来获得
- Embedding Layer
输入问题和答案转换成向量
- QA Encoding Layer
将上一层的输出作为输入,输入到BILSTM模型中,用于提取文字信息,再通过最大池化来形成注意力向量
- Attention-Based SLEN
- Attention Module
使用注意力模块来加强问题和答案之间的呈现,能更好的关注句意
- Shared Label Embedding Network
用问题标签来训练问题标签和和答案的联合空间,然后再将未标记的答案放如该空间,来或得答案标签。
- Output Layer
计算问题与答案之间的匹配得分,此时的问题和答案都是有分类的
总结:在传统的问答系统中,本文考虑到了对答案来进行分类从而提高问题答案对的返回速率与准确率。对答案进行分类不是依靠人工,而是通过再分析了问题和答案之间的关联之后,参照问题标签与答案之间的关系,虚拟出答案标签。在测试部分也显示出了这个模型的优越性。
(ps:看的第一个英语的期刊,看起来有点头疼,里面还涉及到了很多数据推导公式)