Data Compression
勿在浮砂筑高台
视频内容理解/多模态表征学习、搜索推荐算法
展开
-
【数据压缩】压缩率-图像熵-保真度
关于图像压缩上的几个名词解释:1.平均比特数:对应一张图像上每个像素所采用的平均比特数,L(r_k)为灰度级r_k所使用的比特数,p(r_k)表示对应灰度级的概率; 2.压缩率&相对数据冗余:若b和b'是两个不同的比特数,代表着相同信息;即是同一张图像,采用不同的比特数总数去表示;3.图像的熵:一个具有概率P(E)的随机事件E可被说成是包含I(E)单位的信息;在图像中信息的单位采用比特表示,即log底数底数选择2;定义图像中每种灰度级输出的平均信息为图像的熵;由于定义可知,通过观察图像的直方图就可原创 2015-12-18 17:11:41 · 8563 阅读 · 1 评论 -
【数据压缩】LZW算法原理与源码解析
LZW压缩算法原理非常简单,因而被广泛地采用,已经被引入主流图像文件格式中。该算法由Lempel-Ziv-Welch三人发明,这种技术将定长码字分配给变长信源符号序列,它不需要知道被压缩文件的符号出现概率的先验知识,只需要动态地建立和维护一个字典,和其他压缩算法相比既是缺点也是优点。1. LZW原理 LZW通过建立一个字典(code table),用字典的索引序号代替出现过的字符串序列原创 2015-12-17 21:48:48 · 19458 阅读 · 11 评论 -
【数据压缩】Huffman原理与代码实现
Huffman算法也是一种无损压缩算法,但与上篇文章LZW压缩算法不同,Huffman需要得到每种字符出现概率的先验知识。通过计算字符序列中每种字符出现的频率,为每种字符进行唯一的编码设计,使得频率高的字符占的位数短,而频率低的字符长,来达到压缩的目的。通常可以节省20%~90%的空间,很大程度上依赖数据的特性!Huffman编码是变长编码,即每种字符对应的编码长度不唯一。前缀码:任何一个字符的编码都不是同一字符集中另一种字符编码的前缀。Huffman编码为最优前缀码,即压缩后数据量最小。-------原创 2015-12-21 23:00:14 · 13854 阅读 · 1 评论 -
【数据压缩】JPEG标准与原理解析
为了满足不同应用的需求,JPEG标准包括两种基本的压缩方法:1.基于DCT变换的有损压缩算法;2.基于预测方法的无损压缩算法。基于DCT的基线系统有损压缩技术是到目前为止应用最为广泛的一种压缩方法。1.基于DCT有损压缩技术 下面是编码器和解码器的流程图,压缩过程:原图分成8×8的子块,分别进行正向离散余弦变换(FDCT),对每个8×8子块的系数采用量化表进行量化,最后使用熵编码,输出原创 2015-12-24 19:26:49 · 15376 阅读 · 3 评论