计算机视觉与深度学习-图像分类人物介绍&线性分类器（上）

本文深入探讨了图像分类的定义、影响因素及分类方法，包括基于规则和数据驱动的策略。数据驱动方法涉及图像表示、分类模型（如支持向量机、神经网络）、优化技术和训练过程。此外，还讨论了分类器决策、图像类型，并重点介绍了多类支撑向量机损失函数。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

1 图像分类

从已知的标签集合中为给定的输入图片选定一个类别标签

视角、光照、尺度、遮挡、截断、类内形变、运动模糊、类别繁多

通过硬编码的方法识别物体或者其他类（困难）
已经做的尝试：图像–>边缘检测–>提取角点

1）数据集构建
2）分类器设计与学习
在这里插入图片描述
①图像表示：

②分类模型：

近邻分类器
贝叶斯分类器
线性分类器
- 线性映射，将输入的图像特征映射为类别分数，输入图像与评估模板的匹配程度越高，分类器输出的分数就越高
- 定义、决策、矩阵表示、权值向量、决策边界
支撑向量机分类器
神经网络分类器
随机森林
Adaboost

③优化方法：

④训练过程：

⑥损失函数

是个函数，用于度量预测值与真实值的不一致成都，输出通常是绝对值
输出值作为反馈信号调整分类器参数，以此降低损失值，提升分类器的分类效果
损失函数的一般定义 L = $\frac{1}{N}$ $\sum\limits_{i}$ L $_{i}$ (f(x $_{i}$ ,W),y $_{i}$ )
多类支撑向量机损失
S $_{ij}$ =f $_{j}$ (x $_{i}$ ,w $_{j}$ ,b $_{j}$ )=w $_{j}^{T}$ x ${i}$ +b $_{j}$
- j：类别标签，取值范围{1，2，…，c}；
- w $_{j}$ ,b $_{j}$ ：第j哥类别分类器的参数；
- x $_{i}$ ：表示数据集中的第i个样本
- s $_{ij}$ ：第i个样本第j类别的预测分数
- s $_{yi}$ ：第i个样本真是类别的预测分数
- 第i个样本的多类支撑向量机损失定义如下：
  L $_{i}$ = $\sum\limits_{j≠yi}$ max(0,s $_{ij}-s_{yi}$ +1)