opencv训练自己的分类器_用 Pytorch 训练一个自己的分类器

最新推荐文章于 2022-11-11 17:58:00 发布

weixin_39574943

最新推荐文章于 2022-11-11 17:58:00 发布

阅读量192

点赞数

文章标签： opencv训练自己的分类器 pytorch图片转为rgb

学习一个工具最好的方法就是去使用它。在学习「深度学习」的路上，你需要选择一个用来搭建神经网络的框架，常见的框架包括 Tensorflow，Caffe，Pytorch 等，其中最推荐的是 Pytorch，尤其是对于新手，Pytorch 入门快，易上手，代码非常 pythonic。不论你是自己做 demo 还是做产品级的应用，Pytorch 都能胜任，实在是居家旅行必备。

环境搭建

首先需要搭建软硬件环境，如果有 GPU 的话那最好，没有的话也没关系，跑 demo 还是可以的。如果数据集大的话还是需要 GPU 做支持，GPU 的训练速度是 CPU 的 10 倍以上。操作系统推荐 Linux，我由于工作需要已经把之前的 Linux 换成了 Windows，就主要介绍 Windows。环境搭建的大致步骤如下，如果碰到问题欢迎在下方留言讨论。

安装 python，推荐 python3，本人安装的是 3.7，直接去官网下载 exe 安装即可，要注意的是安装过程中需要勾选 “将其添加到环境变量” 选项，这样就可以直接在命令行输入 python 进入 python 提示符界面了。

如果有 GPU 的话需要安装 GPU 对应的驱动以及 CUDA，驱动直接官网找到对应显卡版本下载安装，CUDA 的话直接搜索 CUDA 点击进入系统选择页面选择自己的系统版本 Download，下载完成安装一下就好了。安装完成之后可以在 "C:Program FilesNVIDIA CorporationNVSMI" 路径下面运行一下 nvidia-smi.exe 确认安装成功。

Download Driverswww.nvidia.com

CUDA Toolkit 10.1 Update 1 Downloaddeveloper.nvidia.com

安装 pytorch，torchvision。在 pytorch 官网主页就可以选择需要的版本以及安装方式，推荐直接 pip 安装，两行命令搞定。

PyTorchpytorch.org

安装完成之后在命令行里验证一下有没有实际安装成功，成功的话应该跟我一样：

训练模型

训练模型中最重要的就是训练集的准备，模型就像是一个小孩子，一开始他啥也不知道，训练的过程就是在“教”他一些。要是一开始“教”的就是错的，那么也不可能期望他能在考试的时候把题目答对是不是。训练集的准备通常需要耗费大量人力物力，所以现在正在往半监督或无监督的方向发展，这是后话。啰嗦这么多，其实我就是想强调训练集的重要性，因为之前吃过亏，在这里提醒一下大家。

这里我使用开放数据集做为例子:

transform

torchvision 中集成了一些开放数据集，可以直接下载。上面的代码创建了训练集和验证集的数据加载器，batch_size 表示每个 batch 中图片的数量，如果显存大的话可以设置大一点如(32/64/128)，shuffle 表示是否打乱数据集，在训练的时候需要打乱，验证的时候自然不需要，num_workers 表示加载数据集的进程数，需要注意在 Windows 上只能设置为1，否则会报错。在 Linux 上可以设置得大一点加快训练速度。

你也可以定义自己的数据集，只需要继承torch.utils.data.Dataset，然后实现一下自己的 __getitem__() 和 __len__() 就可以。下面是一个最简单的例子，你可以根据自己的需求定制: