coco 语义分割_YOLACT++:目前最热门的实时实例分割开源库

YOLACT++是ICCV 2019的YOLACT算法的增强版,提供在Titan Xp上33.5 fps的速度和34.1 mAP的精度。它在COCO数据集上的表现突出,同时保持了实时性能。作者已开源代码,支持多GPU训练和在COCO、Pascal SBD上定制模型。
摘要由CSDN通过智能技术生成

点击我爱计算机视觉标星,更快获取CVML新技术


9d8f56b74e536bb0f9cb326cc474006f.png

dd78be00ba53ddf9c847cecf173f0791.png

YOLACT 是ICCV 2019 接收的实时实例分割论文 YOLACT: Real-time Instance Segmentation 提出的算法,近期该文作者又对此进行了扩展,提出YOLACT++:Better Real-time Instance Segmentation,其 resnet50 模型在Titan Xp 上运行速度达 33.5 fps,在COCO 的test-dev数据集上达到34.1 mAP,并开源了代码。

59d538c63066453b96e4c3ced8984dc4.png

论文作者/代码开发者来自加州大学戴维斯分校。

下图为YOLACT/YOLACT++ 与其他实例分割算法速度和精度的比较:

438546d4e5fa5fcf6963ccffc837ccf5.png

可见 YOLACT 系列具有较大的速度优势,YOLACT++ 则又在 YOLACT基础上精度提高不少。

以下视频为该文作者在ICCV 2019 公布的实例分割Demo:

这些结果并非后期处理的,而是在GPU上实时运行出来的。

YOLACT 网络架构:

2ce5fbd985ea5cf3b2784db28adbba0f.png

在COCO数据集上与其他算法更详细的比较结果:

08730cc9d6467a7b4ef5795a464d41b3.png

YOLACT / YOLACT++ 取得了速度最快的同时,取得了不错的分割精度。

作者已经开源了多个模型:

955bf64f36a7707d00347fa8403f49b6.png

并提供了代码,可以很方便在COCO数据集上评测性能:

# Display qualitative results on COCO. From here on I'll use a confidence threshold of 0.15.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --display

以及对图像和视频上跑实例分割:

# Display qualitative results on the specified image.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=my_image.png# Process an image and save it to another file.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --image=input_image.png:output_image.png# Process a whole folder of images.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --images=path/to/input/folder:path/to/output/folder
# Display a video in real-time. "--video_multiframe" will process that many frames at once for improved performance.# If you want, use "--display_fps" to draw the FPS directly on the frame.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=my_video.mp4# Display a webcam feed in real-time. If you have multiple webcams pass the index of the webcam you want instead of 0.python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=0# Process a video and save it to another file. This uses the same pipeline as the ones above now, so it's fast!python eval.py --trained_model=weights/yolact_base_54_800000.pth --score_threshold=0.15 --top_k=15 --video_multiframe=4 --video=input_video.mp4:output_video.mp4

同时该代码也开放了训练程序,开发者可以很轻松在COCO 、Pascal SBD上训练模型,并添加 多GPU 支持。

如果开发者想要在自己的数据集上训练实例分割,只需要有COCO风格的目标检测标注JSON数据即可。

以下是分割结果示例:

2e2929e5c9c3756a3705ad4b4a9d9764.png

926c01b1891bf859a35844df5af53fc3.png

论文地址:

https://arxiv.org/pdf/1912.06218.pdf

开源地址:

https://github.com/dbolya/yolact

目前该代码已经获得 2K+ 颗星,是近期最热门的实例分割开源库。


图像分割交流群

关注最新最前沿的语义分割、全景分割、实例分割技术,扫码添加CV君拉你入群,(如已为CV君其他账号好友请直接私信)

(请务必注明:分割)

b4389f7297fa745ae2b0e8dbc9b2c886.png

喜欢在QQ交流的童鞋,可以加52CV官方QQ群:805388940。

(不会时时在线,如果没能及时通过验证还请见谅)


ec73fb59556a8e0168afe68b7a47f40b.png

长按关注我爱计算机视觉

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值