ConvNext通过模仿Transformer的架构,将CNN在图像层面的表现高于同期的Transformer state-of-art。这里记录下使用ConvNext进行图像分类的配置过程。
平台环境
实验环境及配置:
Pytorch: 1.12.1
CUDA: 11.6 版本(使用 nvcc --version 查看)
GPU:显存8G
操作系统: ubuntu20.04
1 下载ConvNext源码
源码链接
https://github.com/facebookresearch/ConvNeXt
2 环境配置过程,其实可以参看官方文档中的 install.md 的内容,但这里我记录下自己的环境配置过程
2.1 使用Conda构建convnext的虚拟环境
conda create -n convnext python=3.8 -y
2.2 进入虚拟环境
conda activate convnext
2.3 配置PyTorch环境(可以参看该博客)
conda install pytorch==1.12.1 torchvision==0.13.1 torchaudio==0.12.1 cudatoolkit=11.6