计算机视觉-0基础概念

一.数字图像是什么

我们在计算机世界里,网络世界里看到图片都是数字图像,不管是哪种格式,bmp,jpg,png,统统都是二进制字节码放在内存中。计算机按指定的编解码规则将二进制字节读出来,通过显示器展示出图片。数字图像有很长的发展历史,从英美报纸行业开始,编码、解码、压缩、传输、存储、显示,各种技术蓬勃发展直到今天,出现了很多关于数字图像的概念。

二.openCV是什么

对数字图像进行处理当然可以从字节码级别开始处理,能这么做很厉害,但是太无聊,我们要做的工作是在像素矩阵的基础之上做点东西。openCV是个开源的处理图片的代码工具包,openCV可以直接把各种格式的图像直接读成多维矩阵,或者叫向量空间,每个像素就是这个空间中的一个向量,计算机视觉要从这个矩阵开始进行工作。除了openCV外,还有其他各种工具会用到。

三.图像通道是什么

数字图像和画在纸上的图片、光学胶卷曝光出来的照片不一样,要把图的内容存在计算机中并且能展示给人眼看。在图像数字化过程中,必然损失掉一些细节,图片以大量的像素点的形式记录在计算机上,我们可以用“分辨率”来描述像素的密集程度,也就是与实际画面接近的程度。我们把每一个像素作为一块单独的信息,以最原始的黑白图为例,每一个像素用8bit存储(0~ 255),代表256级不同的灰度,每个位置的像素点都有自己的不同程度的黑白灰,于是一整张黑白照片就被记录下来了。这里的为每个像素点记录灰度数据就叫通道,灰度图是单通道。
而一般的彩色图,每个像素点要记录RGB三个信息,所以这就是三通道,有的图还要在加上透明度信息,这就是四通道。
还有一种HSV三通道模型,分别是色调、饱和度、明度。
等等。
结论:数字图片中,像素的分量就是通道。可以以通道为单位,将每条通道可以单独拿出来处理。

四.图像预处理

传统的计算机视觉主要包括几个工作流程:图像预处理,特征值提取,特征表示,利用数据训练模型。

1、灰度图与灰度直方图

灰度图就是计算机中的黑白照片,每个像素只有一个通道,这个通道也叫灰度通道,数值是0~255,表示这个像素点是有多黑。

在这里插入图片描述在这里插入图片描述在这里插入图片描述灰度直方图均衡化,通过调整像素改变直方图,可以使图片的对比度更高
在这里插入图片描述

2、噪声与滤波

数字图像由电信号保存和传递,所以不可避免会被噪声污染,左为原始图片,右为被噪声污染后。
左为原始图片,右为被噪声污染后
滤波,就是对图片中的像素进行计算,降低噪声。有多种算法,例如均值滤波、高斯滤波、中值滤波等等。

3、阈值二值化

将灰度图处理为二值图,所有像素点只有两种可能0或255,例如文字识别的时候,文字的像素全处理为纯黑,纸张的颜色全处理为纯白。

五、图片特征描述

特征的提取和表示就是:通过提取图像的有用信息,并且丢弃无关信息来简化图像的表示。例如,尺度不变特征变换、方向梯度直方图。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值