Day2:图像分类与基础视觉模型
图像分类是给定一张图片,识别图片中的物体是什么。
与Day1中不同的是,这里的机器学习步骤为:
- 收集数据
- 定义模型
- 训练
- 预测
传统特征工程:在 ImageNet 图像识别挑战赛里,2010 和 2011 年的冠军队伍都使用了经典的视觉方法,基于手工设计的特征 + 机器学习算法实现图像分类,Top-5 错误率在 25% 上下。
受限于人类的智慧,手工设计特征更多局限在像素层面的计算,丢失信息过多,在视觉任务上的性能达到瓶颈。
模型学习的范式
范式一:监督学习
范式二:自监督学习 常见类型有基于代理任务、基于对比学习、基于掩码学习。
数据增强
训练泛化性好的模型,需要大量多样化的数据,而数据的采集标注是有成本的。图像可以经过简单的变换产生一系列“副本”,扩充训练数据集。数据增强常见的有几何变换、色彩变换、随机遮挡,这些操作可以自由组合以生成更复杂的图像数据。
还有涉及OpenMMLab 项目中的配置文件,位于p120页,之后讲述了配置文件的运作方式、数据集等其他概念(留作实际运行时解决问题)