pytorch代码:https://github.com/WangXiaoCao/attention-is-all-you-need-pytorch
参考博客:https://blog.csdn.net/sinat_33761963/article/details/83958802
1.模型结构
每一层网络的输入是前边所有层输出的连接。
公式:
网络的整体结构:
网络包括:(1)feature block即图中第一个卷积块;(2)dense block,
pytorch代码:https://github.com/WangXiaoCao/attention-is-all-you-need-pytorch
参考博客:https://blog.csdn.net/sinat_33761963/article/details/83958802
每一层网络的输入是前边所有层输出的连接。
公式:
网络的整体结构:
网络包括:(1)feature block即图中第一个卷积块;(2)dense block,