本文主要是对最近的两篇transfomer 进行分析
1. inductive bias 归纳偏置
谷歌的MLP-Mixer告诉我们一点,大量的数据是可以战胜inductive bias的,但是显然一点是,数据量小的情况下和ViT是一致的,显得力不从心,存在过拟合的情况。
https://zhuanlan.zhihu.com/p/361686988--动画比较形象的描述了前向推理的过程
本文主要是对最近的两篇transfomer 进行分析
1. inductive bias 归纳偏置
谷歌的MLP-Mixer告诉我们一点,大量的数据是可以战胜inductive bias的,但是显然一点是,数据量小的情况下和ViT是一致的,显得力不从心,存在过拟合的情况。
https://zhuanlan.zhihu.com/p/361686988--动画比较形象的描述了前向推理的过程