数字图像与机器视觉基础补充(1)

最新推荐文章于 2022-10-21 22:52:19 发布

VIP文章学不会编程的XX

最新推荐文章于 2022-10-21 22:52:19 发布

阅读量3.8k

点赞数

文章标签：图像处理计算机视觉 photoshop

本文链接：https://blog.csdn.net/qq_30593663/article/details/122373679

版权

@TOC

一、图片格式介绍

图片格式是计算机存储图片的格式，常见的存储的格式有 bmp，jpg，png，tif，gif，pcx，tga，exif，fpx，svg，psd，cdr，pcd，dxf，ufo，eps，ai，raw，WMF，webp，avif，apng 等。

（一）BMP格式

1.简介
BMP(Bitmap-File)图形文件是Windows采用的图形文件格式，在Windows环境下运行的所有图像处理软件都支持BMP图像文件格式。Windows系统内部各图像绘制操作都是以BMP为基础的。Windows 3.0以前的BMP图文件格式与显示设备有关，因此把这种BMP图像文件格式称为设备相关位图DDB(device-dependent bitmap）文件格式。Windows 3.0以后的BMP图像文件与显示设备无关，因此把这种BMP像文件格式称为设备无关位图DIB(device-independent bitmap）格式（注：Windows 3.0以后，在系统中仍然存在DDB位图，像BitBlt这种函数就是基于DDB位图的，只不过如果你想将图像以BMP格式保存到磁盘文件中时，微软极力推荐你以DIB格式保存），目的是为了让Windows能够在任何类型的显示设备上显示所存储的图像。BMP位图文件默认的文件扩展名是BMP或者bmp（有时它也会以.DIB或.RLE作扩展名）。

2.文件结构
4个部分组成：位图文件头（bitmap-file header）、位图信息头（bitmap-information header）、彩色表（color table）和定义位图的字节(位图数据，即图像数据，Data Bits 或Data Body)阵列。

（二）JPEG格式

1.简介
JPEG（ Joint Photographic Experts Group）即联合图像专家组，是用于连续色调静态图像压缩的一种标准，文件后缀名为.jpg或.jpeg，是最常用的图像文件格式。其主要是采用预测编码（DPCM）、离散余弦变换（DCT）以及熵编码的联合编码方式，以去除冗余的图像和彩色数据，属于有损压缩格式，它能够将图像压缩在很小的储存空间，一定程度上会造成图像数据的损伤。尤其是使用过高的压缩比例，将使最终解压缩后恢复的图像质量降低，如果追求高品质图像，则不宜采用过高的压缩比例。
2.分类
①标准JPEG格式：此类型在网页下载时只能由上而下依序显示图像，直到图像资料全部下载完毕，才能看到图像全貌。
②渐进式JPEG：此类型在网页下载时，先呈现出图像的粗略外观后，再慢慢地呈现出完整的内容，而且存成渐进式JPG格式的文档比存成标准JPG格式的文档要来得小，所以如果要在网页上使用图像，可以多用这种格式。
③JPEG2000：它是新一代的影像压缩法，压缩品质更高，并可改善在无线传输时，常因信号不稳造成马赛克现象及位置错乱的情况，改善传输的品质。
3.特点
优点：

它支持极高的压缩率，因此JPEG图像的下载速度大大加快。
它能够轻松地处理16.8M颜色，可以很好地再现全彩色的图像。
在对图像的压缩处理过程中，该图像格式可以允许自由地在最小文件尺寸（最低图像质量）和最大文件尺寸（最高图像质量）之间选择。
该格式的文件尺寸相对较小，下载速度快，有利于在带宽并不“富裕”的情况下传输。
缺点：
并非所有的浏览器都支持将各种JPEG图像插入网页。
压缩时，可能使图像的质量受到损失，因此不适宜用该格式来显示高清晰度的图像。

（三）GIF格式

1.简介
GIF格式的名称是Graphics Interchange Format的缩写，是在1987年由Compu Serve公司为了填补跨平台图像格式的空白而发展起来的。GIF可以被PC和Mactiontosh等多种平台上被支持。GIF是一种位图。位图的大致原理是：图片由许多的像素组成，每一个像素都被指定了一种颜色，这些像素综合起来就构成了图片。
2.结构

文件头是一个带有识别GIF格式数据流的数据块，用以区分早期版本和新版本。
逻辑屏幕描述区定义了与图像数据相关的图像平面尺寸、彩色深度，并指明后面的调色板数据区属于全局调色板还是局部调色板。若使用的是全局调色板，则生成一个24bit的RGB全局调色板，其中一个基色占用一个字节。
调色板数据区。分通用调色板和局部调色板。其中通用调色板适于文件中所有图像，局部调色板只适于某一个图像。
图像数据区的内容有两类，一类是纯粹的图像数据，一类是用于特殊目的的数据块（包含专用应用程序代码和不可打印的注释信息）。在GIF89a格式的图像文件中，如果一个文件中包含多个图像，图像数据区将依次重复数据块序列。
结束标志区的作用主要是标记整个数据流的结束。
3.特点
GIF格式图像文件的扩展名是“.gif”。
对于灰度图像表现最佳。
具有GIF87a和GIF89a两个版本。
采用改进的LZW压缩算法处理图像数据。
调色板数据有通用调色板和局部调色板之分，有不同的颜色取值。
不支持24bit彩色模式，最多存储256色。

（四）PNG格式

1.简介
便携式网络图形（外语简称PNG、外语全称：Portable Network Graphics），是网上接受的最新图像文件格式。PNG能够提供长度比GIF小30%的无损压缩图像文件。它同时提供 24位和48位真彩色图像支持以及其他诸多技术性支持。由于PNG非常新，所以并不是所有的程序都可以用它来存储图像文件，但Photoshop可以处理PNG图像文件，也可以用PNG图像文件格式存储。
2.结构
PNG图像格式文件（或者称为数据流）由一个8字节的PNG文件署名（PNG file signature）域和按照特定结构组织的3个以上的数据块（chunk）组成。
PNG定义了两种类型的数据块，一种是称为关键数据块（critical chunk），这是必需的数据块，另一种叫做辅助数据块（ancillary chunks），这是可选的数据块。关键数据块定义了4个标准数据块，每个PNG文件都必须包含它们，PNG读写软件也都必须要支持这些数据块。虽然PNG文件规范没有要求PNG编译码器对可选数据块进行编码和译码，但规范提倡支持可选数据块。
3.特点
优点：

PNG 支持高级别无损耗压缩。
PNG 支持 alpha 通道透明度。
PNG 支持伽玛校正。
PNG 支持交错。
PNG 受最新的 Web 浏览器支持。

缺点：

较旧的浏览器和程序可能不支持 PNG 文件。
作为 Internet 文件格式，与 JPEG 的有损耗压缩相比，PNG 提供的压缩量较少。
作为 Internet 文件格式，PNG 对多图像文件或动画文件不提供任何支持。GIF 格式支持多图像文件和动画文件。

二、实例

（一）比较不同位深度BMP文件

选择一张图片，用图画板或其他图像编辑软件(Photoshop/GIMP、cximage、IrfanView)等方式打开。
请添加图片描述
将其另存为BMP格式

bmp格式有单色、16色、256色以及24位四种，分别选择并保存。

效果如下：

将鼠标移至图片上，显示图片大小

请添加图片描述

（二）比较不同格式压缩比

将图片分别保存为BMP、JPG、GIF、PNG格式
请添加图片描述
分别查看大小

因为BMP不是压缩的，所以以它为基准计算压缩比

文件格式	文件大小	压缩比
BMP	5.93MB	—
GIF	798KB	87%
JPG	233KB	96%
PNG	3.04MB	49%

三、图像处理编程

（一）奇异函数分解（SVD）

代码：

import numpy as np
import os
from PIL import Image
import matplotlib.pyplot as plt
import matplotlib as mpl
from pprint import pprint

def restore1(sigma, u, v, K):  # 奇异值、左特征向量、右特征向量
    m = len(u)
    n = len(v[0])
    a = np.zeros((m, n))
    for k in range(K):
        uk = u[:, k].reshape(m, 1)
        vk = v[k].reshape(1, n)
        a += sigma[k] * np.dot(uk, vk)
    a[a < 0] = 0
    a[a > 255] = 255
    # a = a.clip(0, 255)
    return np.rint(a).astype('uint8')

def restore2(sigma, u, v, K):  # 奇异值、左特征向量、右特征向量
    m = len(u)
    n = len(v[0])
    a = np.zeros((m, n))
    for k in range(K+1):
        for i in range(m):
            a[i] += sigma[k] * u[i][k] * v[k]
    a[a < 0] = 0
    a[a > 255] = 255
    return np.rint(a).astype('uint8')

if __name__ == "__main__":
    A = Image.open("F:\\Anaconda3\\project\\jupyter\\picture\\test.jpg", 'r')
    print(A)
    output_path = r'F:\\Anaconda3\\project\\jupyter\\picture\\Output'
    if not os.path.exists(output_path):
        os.mkdir(output_path)
    a = np.array(A)
    print(a.shape)
    K = 50
    u_r, sigma_r, v_r = np.linalg.svd(a[:, :, 0])
    u_g, sigma_g, v_g = np.linalg.svd(a[:, :, 1])
    u_b, sigma_b, v_b = np.linalg.svd(a[:, :, 2])
    plt.figure(figsize=(11, 9), facecolor='w')
    mpl.rcParams['font.sans-serif'] = ['simHei']
    mpl.rcParams['axes.unicode_minus'] = False
    for k in range(1, K+1):
        print(k)
        R = restore1(sigma_r, u_r, v_r, k)
        G = restore1(sigma_g, u_g, v_g, k)
        B = restore1(sigma_b, u_b, v_b, k)
        I = np.stack((R, G, B), axis=2)
        Image.fromarray(I).save('%s\\svd_%d.png' % (output_path, k))
        if k <= 12:
            plt.subplot(3, 4, k)
            plt.imshow(I)
            plt.axis('off'

最低0.47元/天解锁文章

学不会编程的XX

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
打赏
0
评论
数字图像与机器视觉基础补充(1)

@TOC一、图片格式介绍图片格式是计算机存储图片的格式，常见的存储的格式有 bmp，jpg，png，tif，gif，pcx，tga，exif，fpx，svg，psd，cdr，pcd，dxf，ufo，eps，ai，raw，WMF，webp，avif，apng 等。（一）BMP格式1.简介BMP(Bitmap-File)图形文件是Windows采用的图形文件格式，在Windows环境下运行的所有图像处理软件都支持BMP图像文件格式。Windows系统内部各图像绘制操作都是以BMP为基础的。Wind
复制链接

扫一扫