图像分割算法_资源｜南开大学开源新图像分割算法，刷新精度记录

最新推荐文章于 2024-08-11 13:21:52 发布

weixin_39683176

最新推荐文章于 2024-08-11 13:21:52 发布

阅读量190

点赞数

文章标签：图像分割算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39683176/article/details/111393695

版权

最近，南开大学提出一种边缘检测和图像分割算法，被称为首个在图像分割数据集BSDS500上F值(F-Feature)超越数据集本身人工标注平均值的实时算法。

作者之一程明明在微博介绍说，算法中每一步(stage)里的所有卷积层都是有用的，而非过去只要每步最后一个卷积层。

“这是很通用的技巧，基本上干什么任务都用得着，改几行代码就能实现。”程明明说。

目前算法已经开源，一起看一下。

方法介绍

简单来说，研究人员提出一种利用RCF(richer convolutional features)的精准边缘检测器，还能通过反向传播进行训练。

在广泛使用的图像分割数据集BSDS500上进行基准测试时，这个算法在ODS(固定轮廓阈值)情况下，F值达到0.811；在评估速度为30FPS(每秒帧率)情况下，RCF OSD F值达到0.806，达到了比较好的结果。

这是怎么做到的？

研究人员先基于VGG16框架，构建了一个简单的神经网络。可以看出，从conv3_1层到conv4_3层，生成的图像在不断变粗糙，且中间层中包含的很多细节并没有被其它层利用。

这可不行。在研究人员提出这种RCF架构，输入任意大小的图像，就能输出相同大小的边缘映射图。

研究人员将所有来自卷积层的层次特征组合成一个整体框架，其中所有参数均可自动学习多尺度和多水平的特征，检测边缘信息。

这个多尺度算法的pipeline如下：

先改变原始图像的大小构建一组图像金字塔(image pyramid)，将这些图像输入到RCF网络进行前向传递。随后，用双线性插值法将边缘检测图恢复为原始大小，这些边缘图的平均值将输出成高质量边缘检测图。

在BSDS500数据集上评估时，这种方法超过了数据集原始的人类标注平均值。

当被问到这个算法是否超越人类时，程明明表示，算法目前只能获得比BSDS500基准测试的普通人类注释更好的F值，还不能说是“超越”人类。

“如果给人类标注员更多的时间和训练，人类会做得更好。”程明明说。

来自南开大学

目前，这项研究的论文Richer Convolutional Features for Edge Detection已被IEEE TPAMI(IEEE Transactions on Pattern Analysis and Machine Intelligence)期刊收录。

论文由Yun Liu(刘云)、Ming-Ming Cheng(程明明)、Xiaowei Hu(胡晓伟)、Jia-Wang Bia、 Le Zhang、Xiang Bai和Jinhui Tang 7人完成，其中前四位研究人员均来自南开大学媒体计算实验室。

媒体计算实验室主要研究针对可视媒体信息的智能计算方法，在实验室主页上我们看到，实验室“2019级入学的博士生和硕士生已经招满”。

一作刘云本科也毕业于南开大学，现为程明明的博士生，参与的论文经常在CVPR、ACCV和PRCV等顶会现身。

论文二作程明明本科毕业于西电，在牛津大学深造完成后回国，虽然只有34岁，已经是南开大学教授、国家“万人计划”青年拔尖人才，首批天津市杰出青年基金获得者了。

△ 程明明

传送门

博客地址：

https://mmcheng.net/zh/rcfedge/

论文全文：

http://mftp.mmcheng.net/Papers/19PamiEdge.pdf

代码地址：

https://github.com/yun-liu/rcf

来源：量子位

(本文为网络摘录或转载，版权归原作者或刊登媒体所有。如涉及作品版权问题，请联系我们处理。)

weixin_39683176

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。