一、基础积累
1、序列问题(Sequence Problem)
2、序列模型(Sequence Models)
(1)输入输出均为序列数据的模型,序列模型将输入序列数据转换为目标序列的数据
(2)形式:one to many,many to many(seq2seq),many to many
(3)常见的CNN模型:Neural GPU,ByteNet,ConvS2S,带有注意力的CNN模型。
(4)通过RNN模型:
(5)了解什么时自注意力机制,以及seq2seq的编码与解码的过程。
二、论文
1、论文的结构
(1)第一遍主要阅读摘要和模型的构造部分,说明和背景会给初读者带来很多未知的困扰
(2)附录的公式和分析的图进行记录,帮助自己以后写论文
(3)快速了解文章的大意(Abstract+Model)+ 复