计算机视觉第一周作业
-
视觉系统都有哪些构成要素? 以机械臂视觉控制系统为例,说明视觉系统的构成要素。
光源:自然光或专用照明设备
相机:单相机,置于机械臂前端
主机:台式计算机或嵌入式处理器
算法软件:使用Python或其他语言编写的视觉识别算法及程序 -
尝试从模仿人类视觉处理流程的角度,阐述本对课程内容组织的理解。进一步在网上搜索,找到自己认为学习过程中最值得参考的1-2本书(不要太厚)
- 图像进入我们的眼睛,通过层层网络神经处理,逐渐向高层图像理解方向进行,最后输出图像理解结果,人类可以从中得到图像信息(图像中发生着什么)。
- 课程体系中的图像采集模拟人类眼睛对画面的感知;图像预处理模拟视网膜对画面的采集和处理;特征提取、边缘检测、图像分割模拟人类对画面中物体的认识;位置估计、运动估计、相机标定模拟人类对画面中物体行为的理解;三维视觉则模拟人类对整个画面的内在联系的理解。
《OpenCV 3计算机视觉 Python语言实现》
- 本书分9章来介绍计算机视觉的重要概念,所有的概念都融入了一些项目,便于理解。本书详细介绍了多个平台下基于Python的OpenCV安装,介绍了计算机视觉应用的基本操作,包括图像文件的读取与显示,图像处理的基本操作(比如边缘检测等),深度估计与分割,人脸检测与识别,图像的检索,目标的检测与识别,目标跟踪,神经网络的手写体识别。采用OpenCV实践计算机视觉应用时,这本书会有很大帮助和指导意义。
《计算机视觉教程(第2版)》
- 本书较适合初学者从中了解计算机视觉的基本原理和典型技术,解决计算机视觉应用中的一些具体问题。
- 什么是光通量和辐照度?说明几个常见光源的光通量,以及几个常见照明环境的辐照度。
- 光通量:指人眼所能感受到的辐射功率,它等于单位时间内某一波段的辐射能量和该波段的相对视见率的乘积。
- 辐照度:指投射到一平表面上的辐射通量密度。指到达一表平面上,单位时间,单位面积上的辐射能。
- 常用光源的光通量:
|光源| 光通量 |说明
|太阳|3.566x1028 lm–|
|烛光|12.56 lm–|
|白炽灯/钨丝灯|12~24 lm/W–|卤钨灯效率高于白炽灯
|LED灯|110 lm/W–|
|荧光灯和气体放电灯|50~120 lm/W–|气体放电灯如钠灯、汞灯和金属卤化物灯等 - 常用照明环境的辐照度:
场景 照度 (lux) 说明
黑夜 0.001—0.02 月夜则是0.02~0.3
阴天室内 5~50 阴天室外50~500
晴天室内 100~1000
晴天阳光直射 100000
适合阅读 300~750 阅读书刊时需50~60
家用摄像机标准照度 1400
[注]:
光通量:以符号Φ表示,单位是lm(流明) 1lm = 0.00146 W
福照度:以符号E表示,常用单位是lux(勒克斯) 1 lux = 1 lm / m^2
- 结合颜色空间示意图,简述HSI颜色空间中各通道的物理意义,并结合图像实例说明。
HSI颜色空间模型
Hue(H):代表色调,是描述纯色的属性;随圆锥旋转不同的角度对应不同的色调
Saturation(S):代表饱和度,表示的是一种纯色被白光稀释的程度的度量;同一片面,Saturation值越大,越靠外,饱和度越高
Value(I):代表亮度,体现无色的光强度概念;圆锥越向上,Value值越大,亮度越亮
- 说明彩色图像传感器及γ校正的基本原理。
-
彩色图像传感器基本原理:
斜体样式 彩色图像传感器原理:彩色图像传感器通过带颜色的像素点过滤颜色来采集彩色信息。
感光器件大概分成三层,传感器的最上层,附上一层透光膜,增加透光强度并是光能固定投射到第二层的指定位置上;第二层覆盖上一层精密度非常高的薄膜,在该薄膜上刻上按顺序排列三原色中一任意颜色,使得上层传下来的光透过该薄膜后,在最底层的感官单元中获取到指定色调信息,并通过周围的三个感光单元,形成一个像素点,该像素点记录着该点的颜色信息。 -
γ校正基本原理:
人眼对外界光源的感光值与输入光强不是呈线性关系的,而是呈指数型关系的。在低照度下,人眼更容易分辨出亮度的变化,随着照度的增加,人眼不易分辨出亮度的变化。而摄像机感光与输入光强呈线性关系。如图所示人眼和摄像机的感光与实际输入光强的关系,为方便人眼辨识图像,需要将摄像机采集的图像进行gamma校正。