Binary image(二值图像):灰度等级只有两种,也就是说,图像中的任何像素点的灰度值均为0或者255,分别代表黑色和白色。
bit和byte的区别:bite是表示信息的最小单位,而Byte又称为字节,1Byte=8bites,可用于区别256个字母。
Salt and Pepper Impulse Noise (椒盐噪声):又称为脉冲噪声,它随机改变一些像素值,在二值图像上表现为使一些像素点变白,一些像素点变黑。
segmentation:细分
图像以及视频所占储存空间的计算:
比如一幅600×800的普通彩色图像,其宽度为600个像素点,长度为800个像素点,如利用普通的RGB模型表示该彩色图像,需要分别用到一个字节储存该图像在某一个像素点的红色,绿色,蓝色的亮度(灰度)值,则整幅图像需要用到的储存空间大小为:
600×800×24bits/pixel=11520000bits=1.37M bytes
相关换算单位:
1TB=1024GB(吉字节)
1GB=1024MB (兆字节)
1MB=1024KB(千字节)
1KB=1024Byte(字节)
1Byte=8bit(比特/位)
而这张图片经过压缩(JPEG conpression)之后仅仅需要89K bytes,压缩比(compression ratio)达到了大约16:1,大大节省了储存空间。
而对于一个720×480大小的视频,视频的拍摄率是30 frames/sec(帧每秒), 那么储存这个视频需要的空间大小为:
720×480×30 frames/sec×24bits/pixel=237M bits/sec
当使用DVD压缩之后其每秒所需的储存空间仅为5M bits,其压缩比约为48:1,由于视频的帧与帧存在时间上的相关性,所以其数据信息具有更大的冗余度,所以其压缩比要比图片的大。
Binary images(二值图像):是指将图像上的每一个像素只有两种可能的取值或灰度等级状态,只有两个值,0和1,0代表黑,1代表白。
Gray images(灰度图像):灰度图像的数据矩阵归一化的值表示亮度,不同类型取值不同。比如uint8类的取值范围是[0,255],uint16类的取值范围是[0,65535],double类的取值为[0,1]。与二值图像不同的是,灰度图像根据类型的不同,将黑与白分为了很多个梯度,也就是在黑和白之间还有着许多不同的亮度。
Color images(彩色图像):彩色图像又可以分为如下的索引值图像和真彩色图像。
Indexed color images(索引图像):索引图像包括一个数据矩阵X和一个颜色映射(调色板)矩阵map。 数据矩阵X可以有uint8,uint16或double类型的。颜色映射矩阵map是一个N*3的数据阵列,其中每个元素都是位于[0,1]之间的double类型。map矩阵每一行有3列,分别表示红色(R),绿色(G)和蓝色(B)。每个像素的颜色通过X中的颜色值作为map中的下标来获取,即X中的元素:1指向map中的第一行所有元素,10指向map中的第十行所有元素。 i指向map中的第i行所有元素。
Full color images(真彩色图像):每个像素点需要用到24个bits来表示,8个bits用来表示红色 的亮度值,8个bits表示绿色,8个bits表示蓝色。
傅里叶变换(Fourier Transform-数字图像处理的基石)
信号正交的定义:若信号x(t)与y(t)在[0-T]内,有: 则称x(t),y(t)在[0-T]内正交。 通俗点讲:正交是针对波形而言的,如果两个波形在一段时间内内积为零,则他们在这段时间内正交。
在复空间内进行内积的时候,我们需要对其中的一个信号取共轭
控制之美笔记
线性时不变系统的定义/性质:
(1)线性:f(a+b)=f(a)+f(b),结果的叠加等于输入的叠加。
(2)时不变:一列输入不管在什么时候提供,产生的结果是一样的。系统没有内态去区分先后