点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达
介绍
深度学习技术普遍用于非结构化数据,例如文本数据或图像数据。在处理任何类型的数据之前,应先对它有充分的了解。
因此,在本文中,我们将讨论图像并查看它们如何实际存储在计算机上。我们将介绍两种保存图像的流行格式-灰度和RGB格式。
直接开始吧!
黑白或灰度图像如何存储在计算机中?
让我们举个例子。在这里,我们已经采取了黑白图像,也被称为一个 灰度图像。
这是数字8的图像。现在,如果我们进一步放大并且仔细观察,你会发现图像变得失真,并且你会在该图像上看到一些小方框。
这些小方框叫做Pixels。我们经常使用的图像维度是X x Y。这实际上是什么意思?这意味着图像的尺寸就是图像的高度(x)和宽度(y)上的像素数。
在这种情况下,高度为24像素,宽度为16像素。因此,此图像的尺寸将为24 x 16。尽管我们看到的是这种格式的图像,但计算机以数字的形式存储图像
这些像素中的每一个都表示为数值,而这些数字称为像素值。这些像素值表示像素的强度。对于灰度或黑白图像,我们的像素值范围是0到255。
接近零的较小数字表示较深的阴影,而接近255的较大数字表示较浅或白色的阴影。
因此,计算机中的每个图像都以这种形式保存,其中你具有一个数字矩阵,该矩阵也称为Channel
现在你能猜出这个矩阵的形状吗?好吧,它将与图像的高度和宽度上的像素值数量相同。在这种情况下,矩阵的形状将为24 x 16
现在,让我们快速总结一下到目前为止我们已经学到的要点-
图像以数字矩阵的形式存储在计算机中,其中这些数字称为像素值。
这些像素值代表每个像素的强度。
0代表黑色,255代表白色。
数字矩阵称为通道,对于灰度图像,我们只有一个通道。
彩色图像如何存储在计算机上?
现在我们有了关于如何将灰度图像存储在计算机中的想法,让我们看一个彩色图像的示例。让我们以彩色图像为例,这是一条狗的图像,
该图像由许多颜色组成,几乎所有颜色都可以从三种原色(**红色,绿色和蓝色)生成。**我们可以说每个彩色图像都是由这三种颜色或3个通道(红色,绿色和蓝色)
这意味着在彩色图像中,矩阵的数量或通道的数量将会更多。在此特定示例中,我们有3个矩阵:1个用于红色的矩阵,称为红色通道
另一个绿色的称为绿色通道
最后是蓝色的矩阵,也称为蓝色通道。
这些像素都具有从0到255的值,其中每个数字代表像素的强度,或者你可以说红色,绿色和蓝色的阴影。最后,所有这些通道或所有这些矩阵都将叠加在一起,这样,当图像的形状加载到计算机中时,它会是
其中N是整个高度上的像素数,M是整个宽度上的像素数,3表示通道数,在这种情况下,我们有3个通道R,G和B。在我们的示例中,彩色图像的形状将是 **6 x 5 x 3,**因为我们在高度上有6个像素,在宽度上有5个像素,并且存在3个通道。
尾注
本文介绍了两种最常见的图像格式:灰度和RGB,以及它们如何存储在计算机中。
好消息!
小白学视觉知识星球
开始面向外开放啦👇👇👇
下载1:OpenCV-Contrib扩展模块中文版教程
在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。
下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。
下载3:OpenCV实战项目20讲
在「小白学视觉」公众号后台回复:OpenCV实战项目20讲,即可下载含有20个基于OpenCV实现20个实战项目,实现OpenCV学习进阶。
交流群
欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~