【图像分类任务是计算机视觉的核心任务,其目的是根据图像信息中所反映的不同特征,把不同类别的图像区分开来】
【图像分类】
从已知的类别标签集合中为给定的输入图片选定一个类别标签
【难点】
1.视角不同
2.光照不同(明暗面)
3.尺度(相对大小)
4.遮挡
5.形变(猫默认四脚朝地,但是有仰着的,趴着的)
6.背景杂波
7.类内形变(椅子,碗…形状不同,样式不同)
8.运动模糊
9.类别繁多
【基于规则的分类方法】
硬编码(写代码来提取边缘进行识别)
【数据驱动的图像分类方法】
步骤 ①数据集构建(有监督/无监督)
②分类器设计与学习 (归纳规律,设计模型)
③分类器决策
用损失值来评判一个模型的好坏
图像表示:
- 像素表示
- 全局特征表示(GIST:抽出频率的特征,把图片分块,分别抽取特征,依赖全部特征,不适合遮挡)
- 局部特征表示(SIFT:特征+词袋模型,)
分类器:
- 近邻分类器
- 贝叶斯分类器
- 线性分类器
- 支撑向量机分类器
- 神经网络分类器
- 随机森林
- Adaboost
损失函数:
优化方法:
-
一阶方法
*梯度下降
*随即梯度下降
*小批量随机梯度下降 -
二阶方法
*牛顿法
*BFGS
*L-BFGS
训练过程:
- 训练集划分
- 数据预处理
- 数据增强(样本多)
- 欠拟合(在训练集上怎么训练都不行,模型不够) 过拟合(数据集上挺好,现实中不行)
*减小算法复杂度
*使用权重正则项
*使用droput正则化 - 超参数调整(神经元的个数、神经网络的层数)
- 模型集成
【图像分类任务的评价指标】
1.正确率 accuracy
2.错误率 error rate
Top1指标:5个里边 有一个错 就是错的
Top5指标:5个里边 有一个对 就是对的