文中内容均为个人见解,不保证百分百正确。 Overview 使用强化学习(Reinforcement Learning)中SNES方法动态调整attention。 RL名词在该paper中的注释: M t M_t Mt表示MaxOut网络的输出,或是其中某一个hidden layer的输出。 x i x_i xi