Swin-Transformer分类源码(已跑通colab)

最新推荐文章于 2024-07-10 06:09:36 发布

Chiancc

最新推荐文章于 2024-07-10 06:09:36 发布

阅读量3.7k

点赞数 11

分类专栏：深度学习文章标签： transformer 深度学习计算机视觉

本文链接：https://blog.csdn.net/weixin_43614874/article/details/120608862

版权

深度学习专栏收录该内容

3 篇文章 0 订阅

订阅专栏

以下是本文参考的博客，大家有需要可以参考一下：
1、Swin-Transformer分割源码(已跑通)
2、Swin-Transformer分类源码(已跑通)
3、swin transformer理解要点

一、概要

最近swin-transformer大火，代码已经开源，girhub直接飙到4.5k。估计接下来关于和swin-transformer相结合的各种网络结构paper就要出来了。关于Swin-Transformer的原理，网上有许多大佬已经做了讲解，下面会放一些有助于理解的博客。本文主要分享如何在colab上跑通源码，博主折腾的过程中也踩了很多坑。

二、正文

1. 相关博客分享

A、与代码相关的讲解
(1)、CV+Transformer之Swin Transformer，这篇是知乎一个大佬最早分享的关于swin-transformer代码讲解的博客。这里面的代码不是官方开源的代码，算是野生代码。但也很有助于对swin-transformer的理解，大家可以参考。
(2)、图解Swin Transformer，这篇是关于官方源代码的讲解了，主要讲的是swin-transformer的结构。
B、与论文原理相关的讲解
2021-Swin Transformer Attention机制的详细推导，这篇博客相当详尽，也是最近才发现的，里面竟然手推了复杂度的计算公式，还有一些attention mask的计算，可以参考一波儿。想要好好理解swin-transformer真的非常建议论文和代码结合着读，相互印证，才可以更好的理解，也方便自己魔改，各种应用。

2、官方Swin-Transformer源码

👉戳右边：Swin-Transformer源码
对了，我主要分享关于分类应用的代码。分类问题比较简单，利用这个任务去了解swin-transformer再合适不过了。

下面给出中文步骤：
2.1、把这份代码clone到你的服务器或者本地，我将其clone到colab上

git clone https://github.com/microsoft/Swin-Transformer.git
cd Swin-Transformer

如图所示：在这里插入图片描述
2.2、创建运行环境，并进入环境
由于colab并没有安装conda，所以首先要安装conda。直接在colab终端中执行以下命令：

%%bash
MINICONDA_INSTALLER_SCRIPT=Miniconda3-4.5.4-Linux-x86_64.sh
MINICONDA_PREFIX=/usr/local
wget https://repo.continuum.io/miniconda/$MINICONDA_INSTALLER_SCRIPT
chmod +x $MINICONDA_INSTALLER_SCRIPT
./$MINICONDA_INSTALLER_SCRIPT -b -f -p $MINICONDA_PREFIX

安装结束后可用conda -V查看conda版本以确定安装成功。
然后再利用conda创建并激活swin虚拟环境

conda create -n swin python=3.7 -y
conda activate swin

2.3、安装需要的环境

conda install pytorch==1.7.1 torchvision==0.8.2 cudatoolkit=10.1 -c pytorch

这里注意一下自己的环境，我这边的cuda是10.1的，所以可以直接按着官方给的这个来。怎么看自己的cuda环境呢，有很多种方法，最靠谱的是这个：
cat /usr/local/cuda/version.txt

安装timm==0.3.2

pip install timm==0.3.2

好了，大头来了，坑爹的apex，安装它是相当的难受。
我在colab上按照官方那个操作直接报错，然后我在How to install nvidia apex on Google Colab上找到了有效的方法。见下：

%%writefile setup.sh

export CUDA_HOME=/usr/local/cuda-10.1
git clone https://github.com/NVIDIA/apex
pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./apex

以上命令亲测有效，但是执行pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" ./apex这个命令耗时较长，需耐心等待。
安装过程如下图：
在这里插入图片描述
安装成功
成功安装

2.4、剩余环境

pip install opencv-python==4.4.0.46 termcolor==1.1.0 yacs==0.1.8

如果以上顺利的话，那么到此环境就已经配置完毕！！！

3、数据集

官方这边匹配代码的数据集是imagenet，但是imagenet太大了，咱只是想跑通一下，然后看看里面的源码咋回事儿，犯不着去下载这么大的数据。本文采用的数据集来自Swin-Transformer分类源码(已跑通)，
网盘链接提取码：uwew
将数据集压缩包上传至colab后，还需要对其进行解压

# zip文件解压
!pip install pyunpack
!pip install patool
from pyunpack import Archive
Archive('/content/drive/MyDrive/Swin-Transformer/imagenet.zip').extractall('/content/Swin-Transformer/imagenet')

4、训练

有了数据，有了代码，那就运行了

首先是训练的运行方式：

python -m torch.distributed.launch --nproc_per_node 1 --master_port 12345 main.py --cfg configs/swin_tiny_patch4_window7_224.yaml --data-path imagenet --batch-size 64

然后是测试的运行方式：

python -m torch.distributed.launch --nproc_per_node 1 --master_port 12345 main.py --eval --cfg configs/swin_tiny_patch4_window7_224.yaml --resume /pth/swin_tiny_patch4_window7_224.pth --data-path imagenet

Swin-Transformer文件目录
pth文件夹网盘链接中也有，链接里面的apex可忽略不管，用我上面提到的apex安装命令进行安装即可。
在这里插入图片描述