Computer Vision(C. Rasche)计算机视觉 论文解读(2 Simple Image Manipulations)

本文介绍了计算机视觉中的基础图像处理操作,包括图像格式、阈值处理、转换,以及简单的面部部分检测。通过灰度转换、阈值化和模糊处理展示了图像的基本操作。同时,探讨了一维积分轮廓在面部特征检测中的应用,强调了信号处理和滤波在提高特征定位准确性中的作用。
摘要由CSDN通过智能技术生成

2 Simple Image Manipulations

为了熟悉一些基础知识,我们在本节中执行一些简单的图像处理操作。 首先,我们了解图像格式和一些基本操作,如阈值处理和数据类型转换(第2.1节)。 然后我们介绍一个简单的面部部分定位检测器(第2.2节)。

2.1 Image Format, Thresholding, Conversion

典型的数字图像,例如jpeg图像,作为三维数组。 前两个维度对应于空间轴x和y。 第三维将颜色信息保存在三个“通道”中,即红色,绿色和蓝色(RGB)。 颜色值通常在0到255之间,并且存储为无符号整数,特别是uint8,数字8代表8位,设计的数据类型用于精确保持该范围(255 = 2^8-1)。 对于每个像素,存在24位(3 * 8位),其允许存储256×256×256≈1670万种颜色。 尽管有丰富的颜色信息,但仅使用该图像的灰度版本,计算机通常更方便,因此将信息减少回每像素8位。 要将RGB图像转换为灰度图像,可以通过根据特定比率添加三个分量将颜色值转换为灰度值L,例如:

                                                       L = 0.2989\cdot R+0.5870\cdot G+0.1140\cdot B                             (1)

Matlab中,可以使用命令imread加载图像。 要将其转换为灰度图像,存在函数rgb2gray。 为了显示图像,我们使用函数imagesc(图像比例),为此我们使用函数figure初始化图形。 函数clf清除图形。 使用命令subplot可以将多个图像打包到同一个图中。 以下代码显示了如何使用这些命令,其输出如图1所示。

clear;                              % clear memory
Irgb    = imread(’yellowlily.jpg’); % load jpg image
Igry    = rgb2gray(Irgb);           % convert it to gray-scale
IrgbCen = Irgb(400:1200,300:900,:); % zoom into center
Igreen  = Irgb(:,:,2);              % green channel only
BWflw   = Igry>100;                 % thresholded (black-white image)
Iblur   = conv2(single(Igry),ones(25,25));    % blurring the image

%% -----   Plotting    ------
figure(1); clf; [nr nc] = deal(3,2);
subplot(nr,nc,1); imagesc(Irgb); title(’Original’);
subplot(nr,nc,2); imagesc(Igry); colormap(gray); title(’Gray-Scale’);
subplot(nr,nc,3); imagesc(IrgbCen); title(’Sub-Selection (Zoom)’);
subplot(nr,nc,4); imhist(Igreen); title(’Histogram of Green Channel’);
subplot(nr,nc,5); imagesc(BWflw); title(’Black-White (Logical) Image’);
subplot(nr,nc,6); imagesc(Iblur); title(’Blurred Image’);

要选择图像的一部分 - 请参阅注释'zoom into center' - ,我们首先指定行号 - 首先指定垂直轴 - 然后指定列号 - 水平轴。 也就是说,人们将索引指定为数学中的矩阵。

Black-White Image  我们可以通过应用关系运算符来threshold图像,参见行BWflw = Igry> 100,在这种情况下,图像会自动转换为逻辑数据类型,即true或false,即一位(值分别为1和0)。 该数据类型的图像有时也称为黑白图像,因此变量的名称为BW。 在上面的代码示例中,我们尝试将花与其背景分开,因此它也被称为前景/背景分离。 我们在某种程度上任意选择了阈值,当然,根据直方图选择阈值是有意义的,例如如图所示的灰度值的直方图。 我们在第9节中对此

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值