深度学习中的分类与回归任务

最新推荐文章于 2024-07-25 12:58:40 发布

lucky公主

最新推荐文章于 2024-07-25 12:58:40 发布

阅读量6k

点赞数 6

文章标签：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44987948/article/details/109165215

版权

在这里插入图片描述
分类：输入一张猫的图片，最终要输出这张图片就是猫的概率；
定位：输入猫的图片，输出一个box，框出猫，得到这个box矩形的初始位置，用x，y表示，再得到矩形的宽和高；
分类+定位：不光要定位出猫的位置，还要确定这张图片就是猫。
在这里插入图片描述
首先，输入一张图片，经过一个CNN，提取出一个高维的特征，最后面一层不再接softmax进行分类，而是预测出4个坐标值，由[x,y,w,h]组成，那么如何来计算这四个值呢？
对于每一张图片，我们有一个grounding truth，grounding truth就是给定的框的实际数据，我们要做的就是使神经网络预测出来的框不断地拟合给定的输入，即不断接近真正的框。我们用L2欧式距离计算差异值，预测出来的框和grounding truth越接近，loss值越小，利用SGD对CNN的参数不断调节，让loss达到收敛的预期效果。这一过程就可以称之为回归过程。
在这里插入图片描述
当对输入图像提取出高维特征之

最低0.47元/天解锁文章

关注

6
点赞
踩
32

收藏

觉得还不错? 一键收藏
1
评论
深度学习中的分类与回归任务

分类：输入一张猫的图片，最终要输出这张图片就是猫的概率；定位：输入猫的图片，输出一个box，框出猫，得到这个box矩形的初始位置，用x，y表示，再得到矩形的宽和高；分类+定位：不光要定位出猫的位置，还要确定这张图片就是猫。首先，输入一张图片，经过一个CNN，提取出一个高维的特征，最后面一层不再接softmax进行分类，而是预测出4个坐标值，由[x,y,w,h]组成，那么如何来计算这四个值呢？对于每一张图片，我们有一个grounding truth，grounding truth就是给定的框的实际.
复制链接

扫一扫

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。