[论文]Pseudo-Sequence-Based 2-D Hierarchical Coding Structure for Light-Field Image Compression

总结

目前看到的方法,无论是利用数学工具(低秩、稀疏编码)还是HEVC等,本质都是得到一张预测图(视差引导的对齐图、视差补偿的稀疏编码图、运动补偿预测图),传输残差图和变换方式,达到减少传输数据量的目的。

摘要

使用伪视频序列的方法对光场图像矩阵进行压缩。提出了三个方法更高效地处理光场在空间和角度上地冗余。方法一,给出一种生成伪视频的帧排列方法,方法二,计算当前图和备选参考图之间的距离,用来挑选一张较好的参考图,也用于位移矢量缩放。方法三,最优比特分配法考虑了不同的图像对下一帧编码图像的影响,进一步去冗余,提高编码效率。

关键词

比特分配  分层编码结构 HEVC 光场图像 伪序列

相关工作

当前的光场压缩均利用了传统压缩用具的优势,分为两类。一类是使用标准的图像压缩方法,基于自相似性压缩光场图像(图像B编码或者帧内块复制IBC);但是自相似性的方法不能够完全发现不同子图之间的相关性。另一类是伪视频方法(子图是DCT/DWT或者基于块的运动估计补偿);但是光场子图采样率高,数量多;现有的生成序列方法很粗糙,不能够完全发现不同子图之间的相关性。

方法一

总结:视频编码前重排的原理是根据IPB帧,常采用IPBBPBB的顺序即0635421,对行和列进行重新排序,以增加压缩比。

                                                                                           图1

首先,取出图片质量较好的1-164号子图,作为压缩对象。接下来,找到和其他视角的子图像相似度最高的图作为I帧,使用平均帧内每一个像素点的差值大小,作为相似度评判标准。

                                                    表1

表1显示了12张测试图像中,编号为POC的图像是当前测试图像中可作为相似度最高的图像。可发现,最优子图的位置在子孔径图像矩阵的中心位置。

                                                                                                            图2

在1维层级编码结构中,一种深度优先的帧重排顺序,将16帧划为一个GOP,对其中的每一帧进行重新排列,这种方式可以最小化参考帧的缓冲区大小。如图所示16帧为一个GOP时,参考帧缓冲区的大小为5。

为了加大压缩比,通常在I帧后面相隔2帧(最多3帧)设置1个P帧,在I、P帧之间都是B帧,在两个P帧之间也是设置2~3帧B帧。B帧传送它与I帧或P帧之间的差值信息,或者P帧与后面P帧或I帧之间的差值信息,或者它与前后I、P帧或P、P帧平均值之间的差值信息。当主体内容变化愈大时,两个I画面之间的帧数值越小;当主体内容变化小时,I面画的间隔可以适当大一些。或者说,B帧、P帧所占比例越大,图像压缩比越高。一般两个I画面相隔13~15帧,相隔帧数不宜再多。

总的来说是按照传统IPBBPBB的方式,二分优先,其次是顺序。最下方是第一行,一次向上递增。最右下角是第0帧,依次编号。编完第0行再编最右边的第一列。第3行编完再编第5行。每一行的顺序是自右向左0635421,按列将行排序的顺序是0(右边一列公共列)635412。

                                                         图3

红色:被当作参考帧的概率最大,整个编码区域(象限)内所有的帧均可以把红色帧作为自己的参考帧,这些红色帧的存在保证了对当前帧的很好的预测。

绿色:整个编码区域内位于同一行的帧均可以把绿色帧作为自己的参考帧。

黄色:紧挨着黄色的26号帧的下一帧-27号可以吧26号作为参考。

灰色:不能被选为其他帧的参考帧。

方法二

总结:

当GOP=16时,缓冲区最多需要存12张参考帧,如果所有需要预测的帧都需要从缓冲区提取参考帧,那么缓冲区的帧数为48,这样的规定动态地增大了编码的复杂度。而且,大量的参考帧增加了附加位比特数(overhead bits,基于距离的参考帧选择算法减少了附加位的比特数并且减少了编码的复杂度;不同子图的空间位置在合并过程中对运动矢量的缩放和向前的运动矢量预测模式均有影响。因此提出的基于空间坐标的运动矢量(MV)缩放法能提高编码效率。

使用(1)(2)对图1建立坐标系,标号从0开始,右下时正方向。

根据图2,对于17号,16、15、12、6、3、|| 38、41、44、77、80、0均是参考帧。

list0代表前向参考帧(标号<17),list1代表后向参考帧(标号>17)。假定每个list中参考帧的数量=4,通过计算欧式距离对两个list 中的参考帧进行从小到大排序list0={16,6,15 ,3},list={44,41,0,80}。

除了在参考帧的选择上,建立空间坐标系的另一个作用时运动矢量缩放。

在预测帧和它的相邻帧在相同的行或者列上时,运动矢量缩放=0。。。。

。。。。。。。。。。。。。。。

方法三

红色帧被选为参考帧的概率最大,会影响整个序列的预测,因此需要分配尽量多的比特去描述。黑色帧不作为参考帧,因此分配较少的比特即可。

不使用QP而是使用拉格朗日乘子法中的lamuda(i),去衡量失真和比特数。

在给定序列的总比特数上限,保证序列的失真最小的情况下,寻找最优的编码参数(参考图像选择、QP、运动矢量、残差等),这是一个有约束的优化问题。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值