CV图像处理

最新推荐文章于 2024-08-05 17:08:52 发布

善为者常成，乐行者常至

最新推荐文章于 2024-08-05 17:08:52 发布

阅读量969

点赞数 1

分类专栏： Python&计算机视觉文章标签：计算机视觉机器学习深度学习

本文链接：https://blog.csdn.net/weixin_43391584/article/details/118370284

版权

计算机视觉与深度学习

图像分类任务是计算机视觉中的核心任务，其目的是根据图像信息中所反映的不同特征，把不同类别的图像区分开来。

通过硬编码的方法识别猫或其他类：

def classify_image(image):
    # Do something magical here
    return class_label

已经做过的尝试：

图像表示：像素表示；全局特征表示(如GIST)；局部特征表示(SIFT)；特征+词袋模型。
**分类器：**近邻分类器；贝叶斯分类器；线性分类器；支撑向量机分类器；神经网络分类器；随机森林；Adaboost。
**损失函数：**0-1损失；多类支撑向量机损失；交叉熵损失；L1损失；L2损失；…
优化算法：
- 一阶方法：
  - 梯度下降；随机梯度下降；小批量随机梯度下降。
- 二阶方法：
  - 牛顿法；BFGS；L-BFGS。
训练过程：
- 数据集划分；
- 数据预处理；
- 数据增强；
- 欠拟合与过拟合；
  - 减少算法复杂度；使用权重正则项；使用droput正则化。
- 超参数调整；
- 模型集成。

**CIFAR10 数据集：**分类的前提是分类对象。

在这里插入图片描述

**Binary(二进制图像)：**非白即黑；

**Gray Scale(灰度图像)：**每个像素位于0~255之间。

**Color(彩色图像)：**三个字节表示(RGB三个域，每个域位于0~255之间)

大多数分类算法都要求输入向量！

将图像转换成向量的方法有很多，这里我们用一种最简单的方法，直接将图像矩阵转换为向量。

线性分类器是一种线性映射，将输入的图像特征映射为类别分数。

$x$ 代表输入的 $d$ 维图像向量， $c$ 为类别个数。

关注

专栏目录