python图像分类实验总结_第4章 图像分类(image classification)基础

第4章 图像分类基础

一张图片胜过千言万语。我们不断地攫取视觉内容,解释它的含义,并且存储它们以备后用。

但是,对于计算机要解释一张图片的内容是很难的,因为计算机看到的图片是一个大的数字矩阵,它对图像传递的思想、知识和意义一无所知。

为了理解图像的内容,我们必须应用图像分类(image classification),这是使用计算机视觉和机器学习算法从图像中抽取意义的任务。这个操作可以简单的为一张图像分配一个标签,如猫、狗还是大象,或者也可以高级到解释图像的内容并且返回一个人类可读的句子。

图像分类是一个非常大的研究领域,包括各种各样的技术,随着深度学习的普及,它还在继续发展。

现在,是时候来驾驭深度学习与图像分类的浪潮了!

图像分类和图像理解是目前(并将继续是)未来十年最受欢迎的计算机视觉子领域。

在本章中,我将提供图像分类的高级概述,以及图像分类算法必须克服的许多挑战。我们还会复习与图像分类和机器学习相关的三种不同学习类型。最后,我们将通过讨论四个步骤来总结本章,这四个步骤是如何训练一个用于图像分类的深度学习网络,以及这四个步骤是如何与传统的手工设计的特征提取管道进行比较的。

1          图像分类是什么?

图像分类,核心是从给定的分类集合中给图像分配一个标签的任务。实际上,这意味着我们的任务是分析一个输入图像并返回一个将图像分类的标签。标签总是来自预定义的可能类别集。

示例:我们假定一个可能的类别集categories = {dog, cat, panda},之后我们提供一张图片(图1)给分类系统:

图1 图像分类目标是根据输入图片且根据预定义类别分配标签

这里的目标是根据输入图像,从类别集中分配一个类别,这里为dog。

我们的分类系统也可以根据概率给图像分配多个标签,如dog:95%,cat:4%,panda:1%。

更一般的,给定三个通道的W*H像素,我们的目标是取W*H*3=N个像素且找出正确分类图像内容的方法。

1.1  关于术语的说明

当执行机器学习和深度学习时,数据集(dataset)是我们尝试提取知识的地方。在数据集中的每个例子/条目(可能使图像数据、文本数据、语音数据)称为数据点(data point)。

图2 数据集是数据点的集合

我们的目标是应用机器学习和深度学习算法来发现在数据集中的潜在模式,使我们能够正确的分类我们的算法还没有遇到的数据点(即泛化性能)。现在考虑下面的术语:

(1)    在图像分类方面,我们的数据集就是图像的集合;

(2)    因此,每个图像就是一个数据点。

注意:在后续过程中,我们将图像和数据点交替使用,可认为是同一个意义。

1.2  语义上的差异

看图3上部的左右图像,我们能够很容易的分辨出猫和狗,但是对于所有计算机来说看到的则是对应于图3下部左右的大的像素矩阵。

图3 上ÿ

  • 0
    点赞
  • 11
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值