如何理解Inductive bias? - 知乎 Attention注意力机制与self-attention自注意力机制 - 知乎 一文看尽深度学习中的各种注意力机制 - 知乎 论文解读:BERT模型及fine-tuning - 知乎 向图像进击的Transformer! OpenAI提出Image GPT实现高质量图像补全和样本生成 - 知乎 详解深度学习中的Normalization,BN/LN/WN - 知乎 为什么残差连接的网络结构更容易学习? - 知乎 深度学习中的注意力模型(2017版) - 知乎