opencv计算brox光流_计算机视觉基础——数字图像与颜色空间

8926de53f7ed8038a785834df3c213c3.png

欢迎大家关注微信公众号:baihuaML白话机器学习

码字不易,如转载请私信我!!

3ecbc634096a0761b47b6b0120401383.png

在这里,我们一起分享AI的故事。

您可以在后台留言,关于机器学习、深度学习的问题,我们会选择其中的优质问题进行回答!


Hello,大家好。白话机器学习新的一个专题又开始了。在本次专题中,我们呼应“白话”这个概念,为大家科普一些简单的计算机视觉的概念,帮助大家扫盲~~~

今天我们首先聊一聊——数字图像与颜色空间。

我们经常会说做算法其实也是在玩数学,很大的原因就是我们需要将想要分析的对象转化为数字,然后再对数字中存在的规律进行分析。而在计算视觉任务中,我们主要处理的对象就是图像数据。

图像是指使用各种观测系统以不同形式和手段观测客观世界而获得的,可以直接或间接作用于人眼并进而产生视觉的实体。包括:1)各类图片,如普通照片、X光片、遥感图片;2)各类光学图像,如电影、电视画面;3)客观世界在人们心目中的有形想象以及外部描述,如绘画、绘图等。
为了对图像数据进行更好的分析,我们会采用计算机来对其进行进一步的加工处理,也就是离散化、数字化,进而得到了数字图像。

32b6d80b43875bb486b5381e0251eb93.png


其中,图像中每个基本单元叫做图像的元素,简称像素(Pixel)。数字图像处理(Digital Image Processing):是指应用计算机来合成、变换已有的数字图像,从而产生一种新的效果,并把加工处理后的图像重新输出,这个过程称为数字图像处理。也称之为计算机图像处理(Computer Image Processing)。我们在后续的章节中,会陆续介绍一系列数字图像处理的技术。在介绍具体数据之前,我们需要进一步了解数字图像中的数据结构。
对于一张彩色数字图片,我们通常会将它表成一个H×W×C的3维矩阵。其中,H表示图片的宽,W表示图片的高,C表示图片的通道数。H×W描述的就是图片的分辨率,也就是像素点的个数。对于每一个像素点,都会表示一个颜色,用一个C维的向量描述。我们重点聊一聊这个C。
在上文中,我们讲了C是通道数。实际上,C还有另一个重要的意思,就是可以描述不同的颜色空间。而在不同的颜色空间下,C的不同维度也表达了不同含义,换句话说:我们通过赋予C的不同维度不同的含义,用来描述不同的颜色空间。色彩空间


色彩是人的眼睛对于不同频率的光线的不同感受,色彩既是客观存在的(不同频率的光)又是主观感知的,有认识差异。“色彩空间”一词源于西方的“Color Space”,又称作“色域”,色彩学中,人们建立了多种色彩模型,以一维、二维、三维甚至四维空间坐标来表示某一色彩,这种坐标系统所能定义的色彩范围即色彩空间。我们经常用到的色彩空间主要有RGB、CMYK、Lab、HSV等。那色彩空间和图片数据又是什么关系呢?


实际上,C也就是channel的含义,取决于当前图片数据所表示的色彩空间,而图像数据具体的值则表示了在对应色彩空间中的取值。
以RGB色彩空间为例:
对于H×W的彩色图像,在RGB空间,C取值为3,对应的三个通道则分别表示R、G、B(红,绿,蓝),这三种颜色也被称为了三基色。通过三基色,可以构成非常丰富的彩色空间。

cb26fd1aaafd1c0ac410be9a5e4d967a.png


比如,我们在使用PS中的拾色器时候,会看到对应像素点的RGB通道上的值

28dc2db25b05856ebd47ad22a23bacfe.png


对于视觉系统,我们感知到的图像中的每一个像素点都会有一个颜色,在RGB色彩空间中,这个颜色我们表示为(R,G,B)。其中,RGB的取值范围都是在0~255之间。比如,我们如果看到一个像素点颜色为红色,则对应的图像矩阵上的值则为(255,0,0),如果为绿色,则对应的图像矩阵上的值为(0,255,0),蓝色则对应到(0,0,255)。其他颜色则同样由(R,G,B)上不同取值决定。比如:WEB标准颜色。https://baike.baidu.com/item/WEB%E6%A0%87%E5%87%86%E9%A2%9C%E8%89%B2/10874354?fr=aladdin

d1e3da0f4741801d2d06f00fa669ad4b.png


讲到这里,大家应该可以想到,对于一张H×W的彩色图像,图像矩阵实际上就是由H×W个(R,G,B)这样的向量组成,也就是一个3维的矩阵,其中(R,G,B)对应到了第三维上的取值。具体在python-opencv中,表示h*w大小的三通道图像的示意图如下:

3656c2cf99ad6009851e84b6efec271f.png


使用OpenCV读取并打印高宽为3*4三通道的RGB彩色图片,代码如下:

# -*- coding: utf-8 -*-
import cv2
img=cv2.imread('3.png',1)#返回RGB彩色图像
print(img) #打印代表灰度图像的3维矩阵

打印结果:

d376a49c6ca2e89af052fa3ba11131f5.png

快来关注我们啦~

一大波实习,招聘机会也陆续出现!为了大家能够更好地交流。我们也拉了几个算法面试群,感兴趣的小伙伴可以加我微信,欢迎入群~注明:面试群。另外,我们也有算法群,欢迎各位加入,注明:算法群!扫码加下面微信好友!特别提醒:不要骚扰小姐姐~~

bf6f34b4e04924c35f332ecf5130a00e.png

欢迎加入深度学习、机器学习技术研讨群!

966164090

fc70e8829306fa1616d4cf3cf1cd9c45.png

欢迎关注我们的微信公众号:baihuaML,白话机器学习

c582a5f7d75f06ab4250305d16e8241d.png

关注知乎“会写代码的好厨师”

1fea696c9fe0bc05286a0e7d1f52ca49.png
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值