文章思路的框架图如下:
本文涉及到的两个技术点:
(1) match-LSTM: 第一次接触,后面会有详细介绍
(2) Pointer Net: 针对这个网络有专门的解析,这里不再赘述
https://blog.csdn.net/appleml/article/details/76988385
本文还给出了该任务(Machine comprehension) 的解决的两个问题映射模型:
(1) The Sequence Model: 将问题的答案映射为一个整数序列
a
\bm{ a }
a = (
a
1
a_1
a1,
a
2
a_2
a2, …),其中
a
i
a_i
ai是整数,并且是连续的,指的是在context中word的位置
(2) The Boundary Model : 给出答案的起始位置,
a
\bm{a}
a = (
a
s
a_s
as,
a
e
a_e
ae), 其中
a
s
a_s
as是答案的开始位置,
a
e
a_e
ae是答案的结束位置,我们的只需要预测
a
s
a_s
as和
a
e
a_e
ae即可