【核心概念】图像分类和目标检测中的正负样本划分以及架构理解

理心炼丹

已于 2022-07-08 11:01:37 修改

阅读量3.9k

点赞数 9

分类专栏：视觉 YOLO 文章标签：深度学习计算机视觉

于 2022-02-09 16:41:42 首次发布

本文为博主原创文章，未经博主允许不得转载。

本文链接：https://blog.csdn.net/hymn1993/article/details/122836387

版权

YOLO 同时被 2 个专栏收录

30 篇文章 84 订阅 ¥9.90 ¥99.00

订阅专栏

超级会员免费看

40 篇文章 5 订阅

订阅专栏

理解有监督学习的深度学习的关键在于将推理和训练阶段进行分开，分别理解各种深度神经网络架构的推理和训练阶段的操作就可以理解某个模型。

推理阶段是将模型看成一个类似于黑箱的非线性函数，比如通过各种卷积模块的组合构成一个 backbone，输出想要的shape的张量，再去做后处理。

训练阶段是需要划分正负样本，然后根据任务设计一个损失函数，使用优化算法如SGD以迭代的方式更新神经元的weight和bias，优化的目标是最小化损失函数，因此训练好的模型就可以拟合训练集。

我们通常可以把所有的神经网络以 编码器-解码器 的架构进行理解。

图像分类：

推理阶段：输入为图像，然后是编码器（如CNN）进行编码为张量，一般是W/H 减小 x 倍，而通道数C 增加 y 倍，编码成新的张量（W/x, H/x, yC）。然后是 解码器 ，加入FC、softmax 等。当然，也可以将 softmax 之前的全部理解为编码器，把softmax 理解为解

了解本专栏

超级会员免费看

关注

9
点赞
踩
22

收藏

觉得还不错? 一键收藏
打赏
0
评论
【核心概念】图像分类和目标检测中的正负样本划分以及架构理解

图像分类和目标检测中的正负样本划分以及架构理解
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

理心炼丹 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。