计算机视觉
文章平均质量分 80
嘻嘻作者哈哈
喜欢折腾技术。寒窗苦读无人晓,一朝成名天下知。
展开
-
全卷积网络FCN某些知识点笔记
一、全局信息和局部信息 (一)局部信息 提取位置:浅层网络中提取局部信息; 特点:对应的感受野比较小,所以是在网络中的前面部分,提取局部信息,物体的几何信息比较丰富; 目的:有助于分割比较小的目标,细化,提高分割的精确程度。 (二)全局信息 提取位置:深层网络中提取全局信息; 特点:对应的感受野比较大,所以是在网络的中/后部分,提取全局信息,物体的空间信息比较丰富; 目的:有助于分割比较大的目标,提高分割的精确程度。 总结:使用跳跃连接,将局部信息与全局信息进行融合,提高分割准确性。 二、感受野 定原创 2021-03-02 22:06:51 · 2249 阅读 · 2 评论 -
FcaNet从频域角度重新思考CV注意力机制
在看本博客前,请先看原论文:FcaNet论文 前网络设计主流思考角度:depth、width、cardinality、attention。 一、作者主要贡献 作者从频域角度重新思考通道注意力机制,数学上证明了全局平均池化是频域特征分解的一个特例;将通道注意力的预处理方法推广到频域,提出multi-spectral通道注意力,FcaNet并开源。 二、GAP存在的问题 GAP存在的问题:一个通道的特征图直接下采样为一个值,导致其不能很好的原创 2021-02-24 23:57:06 · 1623 阅读 · 9 评论 -
零基础入门语义分割-Task1 赛题理解
赛题地址:零基础入门语义分割-地表建筑物识别 Datawhale地址:零基础入门语义分割-地表建筑物识别 专题 一、解题思路 先用一个基础模型跑通训练过程。搭建好基础框架。 在基础模型的基础上,进行数据增广,扩充数据量。划分出验证集,用于训练过程中调参等等。 使用更强大的模型进行训练。 将多个模型训练的结果进行集成。 二、数据集理解 (一)、RLE 编码与解码 rle是一种有效的二值存储格式,用不同码字来表示连续的黑、白像素数,可以简单有效的对mask进行压缩和解压。 编码解码原创 2021-02-20 19:16:15 · 190 阅读 · 0 评论