数字图像的基本类型
本文讲解10种图像文件的类型和相应的扩展名,主要参考:
https://blog.hubspot.com/insiders/different-types-of-image-files
.https://www.jianshu.com/p/4d8cace82028
.https://www.cnblogs.com/Arvin-JIN/p/9133745.html
Vector vs. Raster
Rastor Image Files
Rastor images, 光栅图像是由一系列的像素,或者是独立的块所组成的。JPEG
, GIF
, PNG
全部都是光栅类图像的扩展。网络上所有的照片都是Raster类型,当图片被伸展的时候,一般会引起模糊,或者是不清晰的现象。另外,这类图像一般要有准确的文件后缀以标识类型。
Vector Image Files
Vector images, 向量图像(矢量图)更加灵活,构建这类图像会使用比例公式而不是像素。EPS, AI, PDF
格式的矢量图一般会在需要频繁resize的场景中所用。一般地,logo以及品牌图形应该用矢量图。
High Resolution vs. Low Resolution
读者应该听说过DPI
与PPI
这两种说法,DPI
表示dots per inch
而PPI
表示pixels per inch
。这两个单位度量从本质上决定了图像中像素的密度是否符合你应用程序中的要求。WEB上显示的图像是72 dpi,这是低分辨率的。但在打印环节中一般需要300+ dpi,这样才能将图像打印清楚。
针对打印设备,dpi表示在1英寸的物理距离内,能够打印的墨点的数量。如果一台打印机的分辨率是4800×1200dpi,那么意味着在X方向(横向)上,两个墨点最近的距离可以达到1/4800英寸;在Y方向(纵向)上,两个墨点的距离可以达到1/1200英寸。通常情况下我们认为600x600DPI以上的图像, 在普通纸上按照更高打印精度(如:4800X1200DPI)的打印是没有意义的。印刷时计算的网点和电脑显示器的显示像素并非相同,ppi表示数字影像的解析度。图像的ppi值越高,画面的细节就越丰富,因为单位面积的像素数量更多,数码相机拍出来的图片因品牌或生产时间不同可能有所不同,常见的有72ppi,180ppi和300ppi。
打印设备的
d
p
i
=
图
片
像
素
需
要
印
刷
的
尺
寸
(
英
寸
为
单
位
)
dpi = \frac{图片像素}{需要印刷的尺寸(英寸为单位)}
dpi=需要印刷的尺寸(英寸为单位)图片像素
Type of Images
图片按照后缀来分,大体上有10种类型。分别是1. JPEG
, PNG
, GIF
, TIFF
, PSD
, PDF
, EPS
, AI
, INDD
, RAW
。下面分别讲解。
JPEG ( or JPG)
JPEG全称(Joint Photographic Experts Group)是常见的图像格式,它由联合照片专家组开发并命名为"ISO 10918-1",JPEG仅仅是一种俗称而已。JPEG因它的有损压缩而得名,JPEG图片的压缩过程为:0. 图像分割;1. 颜色空间转换 RGB --> YCrCb; 2. DCT;3. 数据量化;4. 哈夫曼编码。具体算法可参见:https://www.cnblogs.com/Arvin-JIN/p/9133745.html
,讲的很详细。
PNG
便携式网络图形(Portable Network Graphics)是一种无损压缩的位图图形格式 。其设计目的是试图替代GIF和TIFF文件格式,同时增加一些GIF文件格式所不具备的特性。PNG的名称来源于“可移植网络图形格式(Portable Network Graphic Format,PNG)”,也有一个非官方解释“PNG’s Not GIF”。PNG使用从LZ77派生的无损数据压缩算法,一般应用于JAVA程序、网页或S60程序中,原因是它压缩比高,生成文件体积小。
PNG有这样一些特点:
- 体积小:网络通讯中因受带宽制约,在保证图片清晰、逼真的前提下,网页中不可能大范围的使用文件较大的bmp格式文件。
- 无损压缩:PNG文件采用LZ77算法的派生算法进行压缩,其结果是获得高的压缩比,不损失数据。它利用特殊的编码方法标记重复出现的数据,因而对图像的颜色没有影响,也不可能产生颜色的损失,这样就可以重复保存而不降低图像质量。
- 索引彩色模式:PNG-8格式与GIF图像类似,同样采用8位调色板将RGB彩色图像转换为索引彩色图像。图像中保存的不再是各个像素的彩色信息,而是从图像中挑选出来的具有代表性的颜色编号,每一编号对应一种颜色,图像的数据量也因此减少,这对彩色图像的传播非常有利。
- 更优化的网络传输显示: PNG图像在浏览器上采用流式浏览,即使经过交错处理的图像会在完全下载之前提供浏览者一个基本的图像内容,然后再逐渐清晰起来。它允许连续读出和写入图像数据,这个特性很适合于在通信过程中显示和生成图像。
- 支持透明效果:PNG可以为原图像定义256个透明层次,使得彩色图像的边缘能与任何背景平滑地融合,从而彻底地消除锯齿边缘。这种功能是GIF和JPEG没有的。
- PNG同时还支持真彩和灰度级图像的Alpha通道透明度。
- 最高支持24位真彩色图像以及8位灰度图像。
- 支持Alpha通道的透明/半透明特性。
- 支持图像亮度的Gamma校准信息。
- 支持存储附加文本信息,以保留图像名称、作者、版权、创作时间、注释等信息。
- 渐近显示和流式读写,适合在网络传输中快速显示预览效果后再展示全貌。
- 使用CRC防止文件出错。
- 最新的PNG标准允许在一个文件内存储多幅图像。
GIF
GIF(Graphics Interchange Format)的原义是“图像互换格式”,是CompuServe公司在 1987 年开发的图像文件格式。GIF文件的数据,是一种基于LZW算法的连续色调的无损压缩格式。其压缩率一般在50%左右,它不属于任何应用程序。GIF格式可以存多幅彩色图像,如果把存于一个文件中的多幅图像数据逐幅读出并显示到屏幕上,就可构成一种最简单的动画。
TIFF
TIFF(Tag Image File Format)图像文件是图形图像处理中常用的格式之一,其图像格式很复杂,但由于它对图像信息的存放灵活多变,可以支持很多色彩系统,而且独立于操作系统,因此得到了广泛应用。在各种地理信息系统、摄影测量与遥感等应用中,要求图像具有地理编码信息,例如图像所在的坐标系、比例尺、图像上点的坐标、经纬度、长度单位及角度单位等等。 它最初由 Aldus公司与微软公司一起为PostScript打印开发。
应用广泛
(1)TIFF可以描述多种类型的图像;(2)TIFF拥有一系列的压缩方案可供选择;(3)TIFF不依赖于具体的硬件;(4)TIFF是一种可移植的文件格式。
可扩展性
在TIFF 6.0中定义了许多扩展,它们允许TIFF提供以下通用功能:
(1)几种主要的压缩方法;(2)多种色彩表示方法;(3)图像质量增强;(4)特殊图像效果;(5)文档的存储和检索帮助。
格式复杂
TIFF文件的复杂性给它的应用带来了一些问题。一方面,要写一种能够识别所有不同标记的软件非常困难。另一方面,一个TIFF文件可以包含多个图像,每个图像都有自己的IFD和一系列标记,并且采用了多种压缩算法。这样也增加了程序设计的复杂度。
文档图像中的TIFF
TIFF格式是文档图像和文档管理系统中的标准格式。在这种环境中它通常使用支持黑白(也称为二值或者单色)图像的CCITT Group IV 2D压缩。在大量生产的环境中,文档通常扫描成黑白图像(而不是彩色或者灰阶图像)以节约存储空间。A4大小200dpi(每英寸点数分辨率)扫描结果平均大小是30KB,而300dpi的扫描结果是50KB。300dpi比200dpi更加常用。
由于TIFF格式支持多页,多页文件能够存在一个TIFF文件中而不是让每个扫描页存在一系列的文件中。
PSD
PSD–Photoshop Document(PSD),是著名的Adobe公司的图像处理软件Photoshop的专用格式。这种格式可以存储Photoshop中所有的图层,通道、参考线、注解和颜色模式等信息。在保存图像时,若图像中包含有层,则一般都用Photoshop(PSD)格式保存。PSD格式在保存时会将文件压缩,以减少占用磁盘空间,但PSD格式所包含图像数据信息较多(如图层、通道、剪辑路径、参考线等),因此比其他格式的图像文件还是要大得多。由于PSD文件保留所有原图像数据信息,因而修改起来较为方便,大多数排版软件不支持PSD格式的文件。
PDF(便携式文件格式,Portable Document Format)是由Adobe Systems在1993年用于文件交换所发展出的文件格式。
PDF主要由三项技术组成:衍生自PostScript;字型嵌入系统;资料压缩及传输系统。它的优点在於跨平台、能保留文件原有格式(Layout)、开放标准,能免版税(Royalty-free)自由开发PDF相容软体,是一个开放标准,2007年12月成为ISO 32000国际标准。
EPS
EPS文件是目前桌面印刷系统普遍使用的通用交换格式当中的一种综合格式。EPS文件格式又被称为带有预视图象的PS格式,它是由一个PostScript语言的文本文件和一个(可选)低分辨率的由PICT或TIFF格式描述的代表像组成。 EPS文件就是包括文件头信息的PostScript 文件,利用文件头信息可使其他应用程序将此文件嵌入文档。
AI
AI是Adobe Illustrator的文件扩展名,是一种矢量图形文件格式。Adobe Illustrator是一种流行的基于矢量图形的绘图程序。AI格式是一个严格限制的,高度简化的EPS子集。AI代表Adobe Illustrator。
RAW
RAW的原意就是“未经加工”。可以理解为:RAW图像就是CMOS或者CCD图像感应器将捕捉到的光源信号转化为数字信号的原始数据。RAW文件是一种记录了数码相机传感器的原始信息,同时记录了由相机拍摄所产生的一些元数据(Metadata,如ISO的设置、快门速度、光圈值、白平衡等)的文件。RAW是未经处理、也未经压缩的格式,可以把RAW概念化为“原始图像编码数据”或更形象的称为“数字底片”。RAW格式的全称是RAW Image Format,在编程中称之为原始。