本文的主要内容是基于中国大学mooc(慕课)中的“Python数据分析与可视化”课程进行整理和总结。
图像的数组表示
图像一般采用RGB色彩模式,图像中的每一个像素点,由红色,绿色和蓝色组成,这三种颜色形成三个颜色通道,每个通道之间进行变化和叠加之后形成各种颜色,其中R,G,B三个颜色通道取值范围均为0-255 ,叠加起来的色彩空间为256^3,RGB形成的颜色包括了人类视力所能感知的所有颜色。所以在计算机的使用中,一般的图像均使用RGB色彩。
在计算机中,图像是一个由像素组成的矩阵,每个元素是一个RGB值,我们可以借助python中的PIL表示图像,使用numpy中的矩阵表示图像中的每一个元素。
from PIL import Image
import numpy as np
im = np.array(Image.open("C:/Users/ABC/introduction to ML with python/AI.jpg"))
print(im.shape,im.dtype)
(401, 800, 3) uint8
可以看到一个图像最终是由三维数据表示,维度分别是高度,宽度和像素RGB值,在第三维度上有三个元素,RGB分别由一个uint8类型表示(uint8取值范围为0-255)。
<