UNIVERSAL TRANSFORMERS读书笔记
ABSTRACT作者提出了一种称为universal transformer(简称UT)的模型,总的来说,该模型就是集合了Transformer和基于RNN结构的神经网络的优点而提出的更加通用的Transformer模型,具体来说它主要结合了这两个模型中的如下优点:UTs combine the parallelizability and global receptive field of feed-forward sequence models like the Transformer with t
原创
2020-08-03 19:06:21 ·
561 阅读 ·
0 评论