卷积神经网络对于基础分类任务:
1.输入图像(image)
2.图像特征提取:
方法一:传统算法(手工提取特征)--HOG,SIFT等
方法二:深度学习(自动提取特征)--卷积神经网络(CNN),自注意力机制(transformer)
3.分类器:
方法一:机器学习--SVM,随机树等
方法二:图像特征进入全连接(FC)即MLP,加上Softmax
4.输出:类别(label)
卷积实现分类框架:
输入图像-->卷积神经网络提取图片特征向量-->特征向量输入MLP-->输出类别
算法缺陷:
①空间依赖性
对于不同位置,相同特征向量,卷积神经网络同样会产生不同分类结果
②背景影响
对于背景噪声大的以及背景占比在图片里过大的,这两种情况都会产生分类错误。
改进方向:
①空间依赖性
方法一:输入图像进行裁剪,设计特定裁剪方式
方法二:对于输入图像进行,旋转偏移等特定移动空间位置等信息操作
方法三:迁移学习,模型学到基础特征
②背景影响
方向一:输入图像进行裁剪,设计特定裁剪方式
方向二:对于第一次经过卷积神经网络训练完成的图像进行二次卷积神经网络,
或者是二次采用:主动学习,多尺度特征融合,注意力机制等
方向三:对于输入图像进行设计降噪方案,例如高斯,中值,双边滤波等
方向四:通过图像分割,将目标与背景分割出来,减少背景影响