CV-图像分类

最新推荐文章于 2024-04-29 22:01:08 发布

巴川笑笑生

最新推荐文章于 2024-04-29 22:01:08 发布

阅读量633

点赞数

分类专栏： CV笔记

欢迎访问我的个人主页巴川笑笑生|记录点滴

本文链接：https://blog.csdn.net/qq_16024557/article/details/115582345

版权

CV笔记专栏收录该内容

4 篇文章 1 订阅

订阅专栏

什么是图像分类

核心任务
根据图像特征进行区分
给图像打标签
是更高级任务的基础

例如目标检测，图像分割

难点

语义鸿沟

视角
光照
尺度
遮挡
形变
背景杂波
类内形变
运动模糊
类别繁多

基于规则的方法

硬编码难以实现

数据驱动的方法

在这里插入图片描述

图像表示

全局特征
局部特征

如SIFT+word bag

像素

分类器

SVM
AdaBoost
随机森林
贝叶斯
线性分类器
神经网络

损失函数

0-1损失
交叉熵
L1 L2

优化算法

一阶迭代
- 梯度下降
- 随机梯度下降
- 小批量随机梯度下降
二阶迭代
- 牛顿法
- BFGS L-BFGS

训练过程

数据集划分
数据预处理
数据增强
过拟合欠拟合
超参数
模型集成

图像类别

二值图像
灰度图像
彩色图像

线性分类器

第i类线性分类器
$f_{i}(w_{i},x)=w_{i}^{T}x+b$
决策规则，哪个函数值最大就是哪个
权值w可以视为模板，匹配程度越高得分越高
权值也可视为超空间的分界面

损失函数

联系模型参数和模型性能指导模型优化参数
度量预测值和真实值的区别，输出通常是非负数（距离）
作为反馈信号，降低损失函数以提升模型性能
一般定义
$L=\frac{1}{N}\sum_{i}L_{i}(f_{i}(w,x_{i}),y_{i})$

正则项

同样一个损失函数值对应的权重不是唯一的
为了选择最优的权重w，我们需要正则项
$L=\frac{1}{N}\sum_{i}L_{i}(f_{i}(w,x_{i}),y_{i})+\lambda R(w)$
前向称为数据项，后项称为正则项
正则项防止过拟合
正则项与数据无关，只与模型有关
$\lambda$ 是超参数

超参数

学习过程前设置的参数，而不是学出来的
对模型性能影响巨大
可以使模型有偏好

$L_{2}$ 正则 $\sum w^{2}$
惩罚大权值，鼓励权值分散
确保尽量把所有维度都用起来，而不是依赖少数特征

$L_{1}$ 正则 $\sum |w|$
弹性正则 $L_{1}+\beta L_{2}$

参数优化

利用损失函数输出做反馈信号调制模型参数，提升模型性能
目标是找到使得L最优的w

梯度下降

方向负梯度
长度步长

算法
while True
w梯度=计算梯度（w,y,L）
w=w-w梯度*学习率

巴川笑笑生

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
CV-图像分类

什么是图像分类核心任务根据图像特征进行区分给图像打标签是更高级任务的基础例如目标检测，图像分割难点语义鸿沟视角光照尺度遮挡形变背景杂波类内形变运动模糊类别繁多基于规则的方法硬编码难以实现数据驱动的方法图像表示全局特征局部特征如SIFT+word bag像素分类器SVMAdaBoost随机森林贝叶斯线性分类器神经网络损失函数0-1损失交叉熵L1 L2优化算法一阶迭代梯度下降随机梯度下降小批量随机梯
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。