图像分类与基础视觉模型
什么是图像分类?
任务标定:给定一张图片,识别图像中的物体是什么。
问题的数学表示:
视觉任务的难点
让机器从数据中学习:
1.收集数据
2.定义模型
3.训练
4.预测
-
机器学习的局限:
- 机器学习算法善于处理低维、分布相对简单的数据
- 图像数据通常再几十万维的空间中以复杂的方式“缠绕”在一起
- 常规的机器学习算法难以处理这种复杂数据分布
-
传统方法:设计图像特征
-
特征工程天花板:手工设计的特征+机器学习算法
-
从特征工程到特征学习:抽象层次提高、数据分布更"规整"
更易于实现分类 -
层次化特征的实现方式:
- 卷积 实现一步特征提取 👉 卷积神经网络
- 特征和图像一样具有二维空间结构
- 后层特征为空间邻域内前层特征的加权求和
卷积神经网络
AlexNet
在 2012 年的竞赛中,来自多伦多大学的团队首次使用深度学
习方法,一举将错误率降低至 15.3% ,而传统视觉算法的性
能已经达到瓶颈,2015 年,卷积网络的性能超越人类。