OpenMMLab 实战营打卡 - 第 7 课

OpenMMLab 实战营打卡 - 第 7 课

注:本博客仅用于个人上课随手笔记

计算机视觉之语义分割代码教学

一、上课笔记

1.安装环境

需要配置好mmcvpytorchcuda等,需要确定mmsegmmcvpytorch无误。我自己的配置是mmcv=2.0.0rc3mmseg=2.0.0rc3,pytorch=1.8.0cuda=11.2.

2.图像预测&视频预测

图像预测

可以运行demo的脚本,输入待预测图片,config,checkpoints的参数,可以输出,输入图片和分割结果以一定透明度叠加后的结果。在Python中也可以使用mmseg.api 下的 show_result_pyplot来展示图片。

视频预测

可以使用mmcv.VideoReader读入视频文件,逐帧处理每张图片输出分割结果。

image-20230211220537927

最后可以在output目录下查看。

3.训练自己的数据集

修改相关的预测类别,调色板以对应类别显示的颜色,修改数据集文件。如果要增加新的数据集类型,在mmseg.datasetinit.py的里面进行注册修改

更改训练集验证集到自己数据的路径。设置一些预训练模型权重,修改config文件(如预测的类别)。

在实际操作中,我选择了Kaggle上的clothes数据集,分割结果如下,左边是真值,右边是处理后结果。

image-20230211221000575

4.测试

基本测试精度指标:IouAcc.验证集进行验证后会计算这两个基本的指标。也可以运行tools/test.py进行测试。

速度指标FPS:可以使用tools/analysis_tools/bench_mark.py 进行预测,指定参数为配置文件和预训练模型。脚本以批处理的形式去处理,输出一秒钟能处理多少张图片, fps: x img/s.表示一秒钟能处理x张图像。

混淆矩阵:使用上一个目录下的confusion_matrix.py进行测试即可。

淆矩阵:使用上一个目录下的confusion_matrix.py进行测试即可。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值