deeplab v3+尝试和解决

最新推荐文章于 2023-08-01 16:42:53 发布

knightprin

最新推荐文章于 2023-08-01 16:42:53 发布

阅读量483

点赞数

分类专栏： Deep learning

本文链接：https://blog.csdn.net/knightprin/article/details/106004749

版权

3 篇文章 0 订阅

订阅专栏

最近一直在鼓捣语义分割，感觉这玩意确实是CV上的高级任务，确实有用。
Deeplab V3+，主要由三部分组成：

backbone
resnet， mobilenet， drn，xception等。然后这儿会引出一个low-level features 和一个output。需注意这里会有一个output-stride的差别，主要在于有没有更多的stride=2的结构。
aspp，空洞空间卷积池化金字塔(atrous spatial pyramid pooling (ASPP)
就是用不同种类的空洞卷积形成特征图，然后降至concatenate起来。
decoder
就是把aspp输出的featuremaps 和 backbone抽取的底层特征，再concatenate起来，让后上采样到原图像的值。做了插值操作。

另，感觉tensorflow的官方版本设计存在一些问题，仅接受513 x 513以及以下的输入，按网络设计而言基本不涉及图像尺寸问题，这个确实不应该发生，所用的pytorch版本就没有这个问题。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

关注关注