图片里有什么信息?
图片是由一个个像素点构成的。
彩色图片每一个像素点的颜色都能被三个数字的RGB色彩标准所代表,分别是红色(Red)、绿色(Green)和蓝色(Blue),每个数字取值0~255。三种颜色合在一起就可以得到人眼能看到的大多数颜色。
黑白照片的像素点由一个数字来代表他的灰度值(gray scale),取值0~255。黑色是0,白色是255。
矩阵:大家好 我又来了
这些像素点的信息可以构成一个矩阵(matrix),矩阵里的每个数字都代表着图片的颜色信息。
比如说这张图:
% MATLAB INPUT: processing_img.mat
clear; clc; close all
A = imread('dog.jpg');
sizeA = size(A)
imshow(A);
title('Original Colored Image')
% MATLAB OUTPUT
sizeA =
327 327 3
这个彩色憨憨就有327行像素和327列像素,每个像素分别对应RGB中的3个数字。
这里我们简化一下概念,只讨论黑白图片压缩,那么就将这张图片转化成黑白的:
% MATLAB INPUT: processing_img.mat
A = im2double(rgb2gray(A));
sizeA = size(A)
storage = sizeA(1) * sizeA(2)
imshow(A);
title('Original Gray Scale Image')
% MATLAB OUTPUT
sizeA =
327 327
storage =
106929
这个黑白憨憨还是有327行像素和327列像素,但每个像素分别对应1个灰度值。这么说来我们需要储存 327 × 327 = 106929 327\times327=106929 327×327=106929组数字。
怎么压缩图片呢?
矩阵的奇异值分解
既然都把图片信息存入矩阵了,就不得不介绍一点线性代数(linear algebra)的内容了。推导的过程可能有些复杂,那就直接上结论吧:
一个 m × n m\times n m×n矩阵 A A A可以被分解成三个矩阵的乘积:
A = U Σ V T A = U \Sigma V^{T} A=UΣVT
将这三个矩阵对应的组成部分依照规则相乘后相加就能得到原矩阵:
A = ∑ i = 1 min ( m , n ) u i σ i v i T A = \sum_{i=1}^{\min (m, n)} \mathbf{u} _{i} \sigma _{i} \mathbf{v} _{i}^{T}