python图像分类实验总结_第4章图像分类（image classification）基础

最新推荐文章于 2022-10-05 08:29:29 发布

weixin_39674978

最新推荐文章于 2022-10-05 08:29:29 发布

阅读量4.6k

点赞数

文章标签： python图像分类实验总结

图像分类是计算机视觉的重要任务，涉及将图像分配到预定义的类别。计算机通过学习从数字矩阵中理解图像内容。本章概述了图像分类的挑战，包括视点、缩放、变形、遮挡、光照、背景杂乱和类内变化。同时，介绍了三种学习类型：监督、非监督和半监督学习，重点关注深度学习中的监督学习。构建深度学习图像分类器涉及收集数据集、划分数据、训练网络和评估性能。此外，对比了基于特征的传统方法与端到端的深度学习方法，强调了深度学习在特征自动学习方面的优势，但也指出泛化能力是关键挑战。

摘要由CSDN通过智能技术生成

第4章图像分类基础

一张图片胜过千言万语。我们不断地攫取视觉内容，解释它的含义，并且存储它们以备后用。

但是，对于计算机要解释一张图片的内容是很难的，因为计算机看到的图片是一个大的数字矩阵，它对图像传递的思想、知识和意义一无所知。

为了理解图像的内容，我们必须应用图像分类(image classification)，这是使用计算机视觉和机器学习算法从图像中抽取意义的任务。这个操作可以简单的为一张图像分配一个标签，如猫、狗还是大象，或者也可以高级到解释图像的内容并且返回一个人类可读的句子。

图像分类是一个非常大的研究领域，包括各种各样的技术，随着深度学习的普及，它还在继续发展。

现在，是时候来驾驭深度学习与图像分类的浪潮了！

图像分类和图像理解是目前(并将继续是)未来十年最受欢迎的计算机视觉子领域。

在本章中，我将提供图像分类的高级概述，以及图像分类算法必须克服的许多挑战。我们还会复习与图像分类和机器学习相关的三种不同学习类型。最后，我们将通过讨论四个步骤来总结本章，这四个步骤是如何训练一个用于图像分类的深度学习网络，以及这四个步骤是如何与传统的手工设计的特征提取管道进行比较的。

1 图像分类是什么？

图像分类，核心是从给定的分类集合中给图像分配一个标签的任务。实际上，这意味着我们的任务是分析一个输入图像并返回一个将图像分类的标签。标签总是来自预定义的可能类别集。

示例：我们假定一个可能的类别集categories = {dog, cat, panda}，之后我们提供一张图片(图1)给分类系统：

图1 图像分类目标是根据输入图片且根据预定义类别分配标签

这里的目标是根据输入图像，从类别集中分配一个类别，这里为dog。

我们的分类系统也可以根据概率给图像分配多个标签，如dog:95%，cat:4%，panda:1%。

更一般的，给定三个通道的W*H像素，我们的目标是取W*H*3=N个像素且找出正确分类图像内容的方法。

1.1 关于术语的说明

当执行机器学习和深度学习时，数据集(dataset)是我们尝试提取知识的地方。在数据集中的每个例子/条目(可能使图像数据、文本数据、语音数据)称为数据点(data point)。

图2 数据集是数据点的集合

我们的目标是应用机器学习和深度学习算法来发现在数据集中的潜在模式，使我们能够正确的分类我们的算法还没有遇到的数据点(即泛化性能)。现在考虑下面的术语：

(1) 在图像分类方面，我们的数据集就是图像的集合；

(2) 因此，每个图像就是一个数据点。

注意：在后续过程中，我们将图像和数据点交替使用，可认为是同一个意义。

1.2 语义上的差异

看图3上部的左右图像，我们能够很容易的分辨出猫和狗，但是对于所有计算机来说看到的则是对应于图3下部左右的大的像素矩阵。

图3 上ÿ

最低0.47元/天解锁文章

weixin_39674978

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。