GluonCV 0.2 — 计算机视觉工具包第二版

GluonCV 0.2 — 计算机视觉工具包第二版

146 人赞了该文章

作者: 

简介

今年四月我们发布了基于Gluon的计算机视觉工具包GluonCV,里面包含了图像识别,图像分割,和物体检测的最新算法复现和预训练模型。

经过丹师们两个月的努力,我们终于完成了GluonCV的第二个版本。这个版本主要包括以下几个亮点:

  • 重新训练过的图像识别模型,精度从75.8%提升到了77.2%,以及新的ResNet变种V1b。
  • 物体检测算法Faster-RCNN。
  • 图像分割算法PSPNet。

图像识别

一转眼从AlexNet发布已经过去六年了,但是图像识别算法的炼丹技巧还在不断改进。为了跟上最新的进展,我们加入了若干新技巧,将ResNet 50精度提升了1.4%

  • 图像预处理的时候,用bilinear而不是bicubic进行缩放。
  • 预测的时候,保持图像比例并剪裁下中间的正方形区域。在0.1里则是剪裁一个长方形后再缩放成正方形。这两个改动将精度从75.8%提高到76.2%
  • 参照Training ImageNet in 1 Hour论文,用1024或2048的batch size,加入5个epoch的learning rate warmup, 最后把每个bottleneck block的最后一个batchnrom层的gamma参数初始化为0。这些技巧将精度从76.2%提高到76.5%
  • 参照SGDR论文,用cosine schedule或cosine schedule代替step schedule来调整learning rate。这个改动将精度从76.5%提高到77.2%

在0.2版里,我们用这些技巧重新训练了ResNetV1,ResNetV2,和MobileNet模型。另外我们还加入了一个ResNet的新变种:ResNetV1b。这个版本的ResNet比V1精度高,比V2速度快,另外还更适合用于迁移学习。

物体检测

在0.1版里我们加入了SSD物体检测算法。SSD的特点是速度快,但是精度相对较低,尤其是在小物体的检测上。这次我们加入了和SSD互补的Faster-RCNN算法,特点是精度高,但是速度较慢。

目前的Faster-RCNN实现是原始版本,精度高于原始论文,但是比加入了各种优化的最新版本要低一些,这是我们在下一个版本将主要解决的问题。GluonCV的0.3版本将包含Faster-RCNN,Mask-RCNN,FPN的最新改进。

图像分割

0.2版本加入了PSPNet算法,精度比0.1里的FCN更高。下一个版本我们会加入精度更高的模型,并且会考虑加入CityScape数据集上的预训练模型。

讨论请点这里

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值