Win10下 Swin Transformer目标检测环境配置流程

Win10下 Swin-Transformer目标检测环境;对于第一次配置mmdetection的同学可能有所帮助。

1.版本环境介绍

Window 10
Visual Studio 2017
python3.7
cuda 10.0
cudnn 7.6.5
pytorch 1.8.0
torchvision 0.9.0
mmcv-full 1.3.8
项目源码下mmdet 2.11.0

2.mmcv-full

  • 这里需要先安装好pytorch 1.8与vs 2017,并将vs 2017的cl.exe添加环变量;

添加下述文件夹至环境变量;由于安装路径不同,个人路径不同。
#####\Microsoft Visual Studio\2017\Community\VC\Tools\MSVC\14.####\bin\Hostx86\x64

git clone https://github.com/open-mmlab/mmcv.git
cd mmcv
pip install -r requirements.txt

#build
python setup.py build_ext
# install
python setup.py develop
  • 最后pip list 查看mmcv版本,当前是版本:1.3.8 。

3.项目下的mmdet安装

  • 切换到Swin-Transformer-Object-Detection项目下,项目代码包含了mmdet库,然后编译安装mmdet。
cd Swin-Transformer-Object-Detection-master
#安装所有依赖
pip install -r requirements.txt 
#编译安装mmdet
python setup.py develop
  • 最后pip list 查看mmdet版本,当前是版本:2.11.0 。

4.apex安装

git clone https://github.com/NVIDIA/apex
cd apex-master
#编译安装
pip install -v --no-cache-dir --global-option="--cpp_ext" --global-option="--cuda_ext" .
  • 最后pip list 查看apex版本,当前是版本:0.1 。

5.demo

  • 首先下载官网预训练模型及对应config;

这里我下载了 :Swin-T (mask_rcnn)
mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_1x_coco.py
mask_rcnn_swin_tiny_patch4_window7_1x.pth

#单图像推理
python demo/image_demo.py demo/demo.jpg configs/swin/mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_1x_coco.py ./checkpoints/mask_rcnn_swin_tiny_patch4_window7_1x.pth
#摄像头推理
python demo/webcam_demo.py configs/swin/mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_1x_coco.py ./checkpoints/mask_rcnn_swin_tiny_patch4_window7_1x.pth
#视频推理并显示
python demo/video_demo.py ./demo/demo.mp4 configs/swin/mask_rcnn_swin_tiny_patch4_window7_mstrain_480-800_adamw_1x_coco.py ./checkpoints/mask_rcnn_swin_tiny_patch4_window7_1x.pth --show

在这里插入图片描述

6.参考地址

原文地址:https://arxiv.org/abs/2103.14030
项目地址:https://github.com/SwinTransformer/Swin-Transformer-Object-Detection
mmcv文档:https://mmcv.readthedocs.io/en/latest/build.html
apex:https://github.com/NVIDIA/apex

  • 5
    点赞
  • 31
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
Transformer发轫于NLP(自然语言处理),并跨界应用到CV(计算机视觉)领域。 Swin Transformer是基于Transformer计算机视觉骨干网,在图像分类、目标检测、实例分割、语义分割等多项下游CV应用中取得了SOTA的性能。该项工作也获得了ICCV 2021顶会最佳论文奖。本课程将手把手地教大家使用labelme标注和使用Swin Transformer训练自己的数据集进行图片和视频的实例分割。  本课程将介绍Transformer及在CV领域的应用、Swin Transformer的原理。 本课程以汽车驾驶场景图片和视频开展项目实践:对汽车行驶场景中的路坑、车、车道线进行物体标注和实例分割。  课程在Windows和Ubuntu系统上分别做项目演示。包括:安装软件环境、安装Pytorch、安装Swin-Transformer-Object-Detection、标注自己的数据集、准备自己的数据集、数据集格式转换(Python脚本完成)、修改配置文件、训练自己的数据集、测试训练出的网络模型、性能统计、日志分析。  本课程提供项目的数据集和相关Python程序文件。相关课程: 《Transformer原理与代码精讲(PyTorch)》https://edu.csdn.net/course/detail/36697《Transformer原理与代码精讲(TensorFlow)》https://edu.csdn.net/course/detail/36699《ViT(Vision Transformer)原理与代码精讲》https://edu.csdn.net/course/detail/36719《DETR原理与代码精讲》https://edu.csdn.net/course/detail/36768《Swin Transformer实战目标检测:训练自己的数据集》https://edu.csdn.net/course/detail/36585《Swin Transformer实战实例分割:训练自己的数据集》https://edu.csdn.net/course/detail/36586《Swin Transformer原理与代码精讲》 https://download.csdn.net/course/detail/37045
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值