计算机视觉(算法与应用):卷积神经网络（图像分类，损失函数，优化设计）

最新推荐文章于 2023-12-31 01:46:46 发布

小珈猫

最新推荐文章于 2023-12-31 01:46:46 发布

阅读量1.4k

点赞数

分类专栏：计算机视觉

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_37194898/article/details/105745015

版权

计算机视觉专栏收录该内容

17 篇文章 0 订阅

订阅专栏

基于卷积神经网络的视觉应用多种多样：三维重建、目标检测、步态检测、图像检索与理解等
在这里插入图片描述

神经网络的三要素：在这里插入图片描述

图像分类

挑战：类内差异；遮挡；角度；光照；背景
机器学习方法：
在这里插入图片描述
第一种分类器：Nearest Neighbor:记住所有的数据和标签
根据相似性，如距离测量

训练集有N个图片，则训练O（1），预测O（N）
该分类器不满足要求
改进版本：https://github.com/facebookresearch/faiss

第二种分类器
K近邻分类器：容易有误
欧几里得距离：
在这里插入图片描述
K的取值以及距离函数的选择属于超参数问题，需要人为选择
他们的取值依赖于问题，一般情况下会试验多个值最后选择一个最佳的。
划分数据集方法：

交叉验证：
分成5个组。其中轮流选择一个组作为Validation,如下图所示，很好理解，从中选择最优即可：
在这里插入图片描述
基于交叉验证的方法去选择K
缺点：测试时非常慢；基于像素的距离测量不靠谱；维度不够（图像三维）。
总结：往往构造一个训练集与测试集，用训练集训练Model,测试集测试；K近邻基于图片之间的相似性，K值选择和距离函数往往要根据实际确定。

第三种分类器
线性分类器：基于一种函数
在这里插入图片描述
举个例子，如下图所示，很好理解。
代数角度：线性运算

从视觉角度看：给出模板在这里插入图片描述
从几何角度看：构造超平面进行正确分割

损失函数

在这里插入图片描述

正则化：

正则化的作用：
1.表达对权值的喜好
2.Make the model simple so is works onn test data(防止过拟合)
3.改善整体优化的结果

Softmax分类器

转化为了概率
在这里插入图片描述
loss取值：0到无穷大

两者比较
在这里插入图片描述
总结：

Optimization(优化)

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
计算机视觉(算法与应用):卷积神经网络（图像分类，损失函数，优化设计）

基于卷积神经网络的视觉应用多种多样：三维重建、目标检测、步态检测、图像检索与理解等神经网络的三要素：图像分类
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。