计算机视觉中的机器学习:从传统方法到现代模型
1. 计算机视觉概述
计算机视觉旨在模仿人类的视觉能力,它主要包含两个方面:图像形成(模拟人类的感官系统)和机器感知(模拟人类的认知系统)。模拟人类感官系统侧重于硬件以及传感器(如相机)的设计与布局;而模拟人类认知系统则依赖于机器学习方法从图像中提取信息。
当我们看到一张雏菊的照片时,人类的认知系统能够识别出它是雏菊。本书所构建的图像分类机器学习模型,正是从雏菊的照片出发,来模仿人类的这种识别能力。
2. 机器学习在计算机视觉中的应用演变
2.1 早期计算机视觉方法
在2010年代初期,从照片中提取信息的方法并不涉及机器学习,而是集中在去噪、边缘检测、纹理检测和形态学(基于形状)操作等方面。
2.2 人工智能与机器学习
人工智能(AI)探索计算机模仿人类能力的方法,而机器学习是AI的一个子领域,它通过向计算机展示大量数据并让其从中学习来实现这一目标。另一个AI子领域是专家系统,它通过编程让计算机遵循人类逻辑来模仿人类能力。
在2010年代之前,像图像分类这样的计算机视觉任务通常通过构建定制的图像滤波器来实现专家制定的逻辑。然而,如今图像分类主要通过卷积网络(一种深度学习形式)来完成。
例如,对于一张雏菊的照片,机器学习方法是向计算机展示大量带有标签(正确答案)的图像,如雏菊、郁金香等的照片,让计算机基于这些有标签的训练数据集学习如何对未见过的图像进行分类。而专家系统方法则是先采访人类植物学家,了解他们对花朵分类的方法,然后设计图像滤波器来匹配这些标准。例如,对于雏菊,会寻找图像中白色、黄色和绿色的分布,设
订阅专栏 解锁全文

被折叠的 条评论
为什么被折叠?



