以下是本文参考的博客,大家有需要可以参考一下:
1、Swin-Transformer分割源码(已跑通)
2、Swin-Transformer分类源码(已跑通)
3、swin transformer理解要点
一、概要
最近swin-transformer大火,代码已经开源,girhub直接飙到4.5k。估计接下来关于和swin-transformer相结合的各种网络结构paper就要出来了。关于Swin-Transformer的原理,网上有许多大佬已经做了讲解,下面会放一些有助于理解的博客。本文主要分享如何在colab上跑通源码,博主折腾的过程中也踩了很多坑。
二、正文
1. 相关博客分享
A、与代码相关的讲解
(1)、CV+Transformer之Swin Transformer,这篇是知乎一个大佬最早分享的关于swin-transformer代码讲解的博客。这里面的代码不是官方开源的代码,算是野生代码。但也很有助于对swin-transformer的理解,大家可以参考。
(2)、图解Swin Transformer,这篇是关于官方源代码的讲解了,主要讲的是swin-transformer的结构。
B、与论文原理相关的讲解
2021-Swin Transformer Attention机制的详细推导,这篇博客相当详尽,也是最近才发现的,里面竟然手推了复杂度的计算公式,还有一些attention mask的计算,可以参考一波儿。想要好好理解swin-transformer真的非常建议论文和代码结合着读,相互印证,才可以更好的理解,也方便自己魔改,各种应用。
2、官方Swin-Transformer源码
👉戳右边:Swin-Transformer源码
对了,我主要分享关于分类应用的代码。分类问题比较简单,利用这个任务去了解swin-transformer再合适不过了。
下面给出中文步骤:
2.1、把这份代码clone到你的服务器或者本地,我将其clone到colab上
git clone https://github.com/microsoft/Swin-Transformer.git
cd Swin-Transformer
如图所示:
2.2、创建运行环境,并进入环境
由于colab并没有安装conda,所以首先要安装conda。直接在colab终端中执行以下命令:
%%bash
MINICONDA_INSTALLER_SCRIPT=Miniconda3-4.5.4-Linux-x86_64.sh
MINICONDA_PREFIX=/usr/local
wget https://repo.continuum.io/miniconda/$MINICONDA_INSTALLER_SCRIPT
chmod +x $MINICONDA_INSTALLER_SCRIPT
./$MINICONDA_INSTALLER_SCRIPT -b -f -p $MINICONDA_PREFIX
安装结束后可用conda -V
查看conda版本以确定安装成功。
然后再利用conda创建并激活swin虚拟环境
conda create -n swin python=3.7 -y
conda activate swin
2.3、安装需要的环境
conda install pytorch==1.7.1 torchvision==0.8.2 cudatoolkit=10.1 -c pytorch
这里注意一下自己的环境,我这边的cuda是10.1的,所以可以直接按着官方给的这个来。怎么看自己的cuda环境呢,有很多种方法,最靠谱的是这个:
cat /usr/local/cuda/version.txt
安装timm==0.3.2
pip install timm==0.3.2
好了,大头来了,坑爹的apex,安装它是相当的难受。
我在colab上按照官方那个操作直接报错,然后我在How to install nvidia apex on Google Colab上找到了有效的方法。见下:
%%writefile setup.sh
export CUDA_HOME=/usr/local/cuda-10.1
git clone https://github.com/NVIDIA/apex
pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./apex
以上命令亲测有效,但是执行pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./apex
这个命令耗时较长,需耐心等待。
安装过程如下图:
安装成功
2.4、剩余环境
pip install opencv-python==4.4.0.46 termcolor==1.1.0 yacs==0.1.8
如果以上顺利的话,那么到此环境就已经配置完毕!!!
3、数据集
官方这边匹配代码的数据集是imagenet,但是imagenet太大了,咱只是想跑通一下,然后看看里面的源码咋回事儿,犯不着去下载这么大的数据。本文采用的数据集来自Swin-Transformer分类源码(已跑通),
网盘链接提取码:uwew
将数据集压缩包上传至colab后,还需要对其进行解压
# zip文件解压
!pip install pyunpack
!pip install patool
from pyunpack import Archive
Archive('/content/drive/MyDrive/Swin-Transformer/imagenet.zip').extractall('/content/Swin-Transformer/imagenet')
4、训练
有了数据,有了代码,那就运行了
首先是训练的运行方式:
python -m torch.distributed.launch --nproc_per_node 1 --master_port 12345 main.py --cfg configs/swin_tiny_patch4_window7_224.yaml --data-path imagenet --batch-size 64
然后是测试的运行方式:
python -m torch.distributed.launch --nproc_per_node 1 --master_port 12345 main.py --eval --cfg configs/swin_tiny_patch4_window7_224.yaml --resume /pth/swin_tiny_patch4_window7_224.pth --data-path imagenet
Swin-Transformer文件目录
pth文件夹网盘链接中也有,链接里面的apex可忽略不管,用我上面提到的apex安装命令进行安装即可。
三、小结
希望可以帮助到大家,如果你觉得这篇文章对你有一定的帮助,那就点个赞支持一下吧!如果有什么问题的话也可以在文章下面评论,我们一起交流解决问题!预祝各位都能跑通!!!