【Computer Vision】神经网络和计算机视觉基础

【认识机器视觉】神经网络和计算机视觉基础



1. 前言

  计算机视觉(Computer Vision)指用计算机模拟人的视觉以处理一系列图像信息。计算机视觉属于机器学习在视觉领域的应用,是一个交叉学科的研究领域,设计数学、物理、生物、计算机工程等基础。目前,互联网的信息中,80%以上都来自视频和图片,随着短视频的流行,可预见的未来,视觉信息可能占据人类信息的90%以上。因此,计算机视觉当之无愧是深度学习技术应用最广的领域,也是人工智能行业中从业人员最多的方向。


2. 生物视觉原理和视觉等级划分

2.1 生物视觉原理

  根据兴奋和抑制的不同,生物细胞包含两类常用的感受野:第一类是由作用强的中心兴奋区域和作用较弱但是面积更大的周边区域抑制区域构成的同心圆结构,称为On型感受野;第二类是中心抑制区域和周边兴奋区域构成的同心圆结构,称为Off型感受野。当用小光点刺激中心的光斑时,细胞发放频率增加。当面机正好可以覆盖On型感受野的中心光斑时,可以得到细胞的最大兴奋型反映了;当用大面积的散射光刺照射On型感受野,细胞被抑制。

2.2 视觉等级划分

  视觉等级理论指出,从二维图像到三维几何结构的复原过程包含3个等级,第一层是简单的边缘信息的提取,这个过程为底层特征提取阶段;第二层是2.5维的结构,它描述方向,轮廓,深度等更为高级、抽象的信息;第三层重建整个物体的模型。


3. 数字图像基础

3.1 灰度化与对比度

  计算机采用的0/1编码,数字图像也是利用0/1来记录信息的,人们平常接触的图像都是二进制的8位数图像,包含了0~255灰度,其中,0代表最黑,255代表最白,亮度从0~255逐渐增加。其实人眼对亮度对比的敏感度远超亮度本身,这也是计算机视觉分层原理的体现。马赫带现象就很直观地揭示了这个现象。

可以看出,虽然每个灰度带地亮度是一样的,但是人眼观测到的结果是:在两个亮度带交界处,暗侧的比亮侧的暗一些。

3.2 分辨率

  数字图像有两个分辨率,即图像分辨率和输出分辨率。

  图像分辨率(Pixels Per Inch,PPI)是指每英寸的像素数。人们常说的像素大小,入2400万像素,使用的就是图像分辨率.其实也是水平像素X垂直像素表示,如果一张图片的像素是6000X4000,那么6000是水平像素的个数,向量相乘等于2400万像素。

  输出分辨率(Dots Per Inch,DPI)是指设备输出图像时每英寸可产生的点数。是指设备每英寸可产生的点数。这两个分辨率的区别就在于Dot和Pixels。Dot指显示器上的物理点,它是物理设备可以解析的最小单位,而Pixels指屏幕分辨率中的最小单位。

1. 相同的PPI,更高的DPI表现物理尺寸更小,因此此时每英寸点更多,每英寸像素更多。
2. 相同的DPI,更高的PPI表现物理尺寸更小,PPI越小,物理设别显示出的像素越模糊。

3.3 彩色空间

  根据图像的通道数,常见的图像分为灰度图像和彩色图像两种,灰度图像只包含亮度信息,彩色图像不仅包含亮度信息,还包含颜色信息。人们平常接触最多的是RGB图像,Red、Green、Blue 3个通道组成,一副图像的每个像素都是由RGB矢量表示。

例如,(255,0,0)表示全红(0,255,0)表示全绿(255,0,0)表示全蓝。除了RGB图像外,常用的颜色空间还有HSV/HSB、HSL、YUV、Lab等,

3.4 数字图像处理基础

3.4.1 直方图

  图像中的直方图用来表示数字图像中的亮度分布,对像素灰度值进行统计就能得到直方图,研究者可以观察直方图来了解图像中的亮度分布情况。在直方图中,左侧为较暗的区域,右侧为较亮的区域。

3.4.2 边缘

  视觉机制和马赫带都表明,人眼对不连续的东西最敏感的,而图像中最常见的不连续就是边缘。边缘检测在计算机视觉和图像处理中都有较基础且广泛的应用。可以通过提取目标的轮廓来识别不同的物体,并且将其作为图像特征表示。传统的边缘检测算法有很多,可以将它们划分为两类:基于一阶导数的方法,基于二阶导数的方法

  其中包括:Roberts、Prewitt、Sobel、Laplacian、Canny算子等,以后有时间单独写一篇关于它们之间的对比和效果文章。

3.4.3 对比度

  图像有高亮度也有低亮度,对应的就是黑与白,目前常采用8字节进行存储,即灰度值0代表最黑,灰度值255代表最亮,不过大多数图像上分布的亮度范围通常小于灰度最大值与最小值之差。这里的最大值与最小值之差就是对比度,视觉上反映出来的就是画面的明暗反差程度。
  对比度有全局对比度和局部对比度之分。增加对比度,画面中的亮区域会更亮,暗区域会更暗,敏感反差会增强。常用的对比度调整方法有:线性拉伸变换、伽马变换、直方图均化等

3.4.4 清晰度

  清晰度是指边缘附近的灰度对比,如果增加清晰度,边缘较暗的一侧会变得更暗,物体轮廓会更加清晰,不过如果清晰度调节过度,会使边缘附近出现晕影。可以通过锐化来增加清晰度,可以通过降低图像的分辨率、增加模糊的方法来降低清晰度。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值