一文看尽深度学习中的各种注意力机制(1998-2020年) https://mp.weixin.qq.com/s/7E2O5Qoyd_GBcZfUCO_CxA 微调预训练模型的新姿势——自集成和自蒸馏 https://zhuanlan.zhihu.com/p/133804801 轻量级网络综述 — 主干网络篇 https://mp.weixin.qq.com/s/Ako1-LftttHyL1YnxVB8tA