linear:全连接层
mataul softmax:激活函数
matmul:矩阵相乘
merge:合并
cropping:裁剪
affine:仿射变换
"linear" 指的是通过全连接层(线性映射)进行的线性变换。在自注意力机制的上下文中,这个线性变换分别应用于 Query(Q)和 Key(K)的输入。经过线性变换后,会将输入的特征映射到另一个空间。
configs:各个模型的参数
datasets:用于记加载和处理数据集。读取图像并对图像格式等进行操作。
utils里面的几个文件没看懂。。。。。。