语义分割
文章平均质量分 90
Xlxlkkxx
这个作者很懒,什么都没留下…
展开
-
03 U2net
原文链接。原创 2023-05-22 20:34:13 · 285 阅读 · 0 评论 -
02 DeepLab系列总结
对 Input Feature Map 以不同采样率的空洞卷积并行采样;将得到的结果 concat ,扩大通道数;最后通过 1 × 1 卷积将通道数降低到预期的数值。相当于以多个比例捕捉图像的上下文。BP解决了网络训练的软件问题(权重更新),pooling解决训练的硬件问题(对计算资源的需求),对像素的位置很敏感,pooling是一个不断丢失位置信息的过程。池化层缩小特征层的尺寸,可以快速扩大感受野。这东西不够好,V3舍弃了CRF,不用管。可以在不增加计算量的情况下。验证时:损失计算,打印。原创 2023-05-22 13:31:51 · 160 阅读 · 0 评论 -
01 FCN(2015)
预测图中通道数==类别数+1,将每个通道的左下角元素做softmax回归;概率最大的通道数就是该像素的预测类别索引,相当于。Constant Warmup:学习率从非常小的数值。刚开始模型对数据完全不了解,此时需要使用小学习率。Linner Warmup:学习率从非常小的数值。Cosine Warmup:学习率先从很小的数值。对数据了解了一段时间之后,可以使用大学习率。指的是下采样32倍,然后还原到原图尺寸。求每个像素的分类问题类别损失,然后求平均。增加到预设学习率,然后按照。时,使用小学习率进行。原创 2023-05-18 13:08:42 · 174 阅读 · 0 评论 -
00 语义分割
在背景处的像素值为0,目标边缘处用的像素值为255(训练时一般会忽略像素值为255的区域),目标区域内根据目标的类别索引信息进行填充,例如人对应的目标索引是15,所以目标区域的像素值用15填充。简单来讲就是重复所给定的一组系数,如r=[1,2,3,1,2,3],r=[1,2,5,1,2,5]类似这种格式。k表示转置卷积的kernel_size大小,s表示转置卷积的步距,p为转置卷积的padding。假设都使用K*K的卷积核,连续多次卷积,膨胀系数应满足如下。ri表示第i个卷积的膨胀系数。原创 2023-05-17 18:45:48 · 35 阅读 · 0 评论