OpenMMLab 实战营打卡 - 第 7 课
注:本博客仅用于个人上课随手笔记
计算机视觉之语义分割代码教学
一、上课笔记
1.安装环境
需要配置好mmcv
,pytorch
,cuda
等,需要确定mmseg
,mmcv
和pytorch
无误。我自己的配置是mmcv=2.0.0rc3
,mmseg=2.0.0rc3
,pytorch=1.8.0
,cuda=11.2
.
2.图像预测&视频预测
图像预测
可以运行demo
的脚本,输入待预测图片,config,checkpoints的参数,可以输出,输入图片和分割结果以一定透明度叠加后的结果。在Python中也可以使用mmseg.api
下的 show_result_pyplot
来展示图片。
视频预测
可以使用mmcv.VideoReader
读入视频文件,逐帧处理每张图片输出分割结果。
最后可以在output目录下查看。
3.训练自己的数据集
修改相关的预测类别,调色板以对应类别显示的颜色,修改数据集文件。如果要增加新的数据集类型,在mmseg.dataset
下init.py
的里面进行注册修改
更改训练集验证集到自己数据的路径。设置一些预训练模型权重,修改config文件(如预测的类别)。
在实际操作中,我选择了Kaggle上的clothes
数据集,分割结果如下,左边是真值,右边是处理后结果。
4.测试
基本测试精度指标:Iou
,Acc
.验证集进行验证后会计算这两个基本的指标。也可以运行tools/test.py
进行测试。
速度指标FPS:可以使用tools/analysis_tools/bench_mark.py
进行预测,指定参数为配置文件和预训练模型。脚本以批处理的形式去处理,输出一秒钟能处理多少张图片, fps:
x img/s.表示一秒钟能处理x张图像。
混淆矩阵:使用上一个目录下的confusion_matrix.py
进行测试即可。
淆矩阵:使用上一个目录下的confusion_matrix.py
进行测试即可。