CVPR2021 | 实现图像的“无限放大”，超详细局部隐式图像函数（LIIF）解读

奥比中光3D视觉开发者社区

已于 2022-03-24 09:33:13 修改

阅读量1.8k

点赞数 4

分类专栏： 3D视觉开发者文章标签：计算机视觉人工智能图像处理

于 2022-03-23 19:00:00 首次发布

本文链接：https://blog.csdn.net/limingmin2020/article/details/123679714

版权

本文详细介绍了CVPR2021会议上提出的局部隐式图像函数（LIIF）技术，该技术实现了图像的“无限放大”。LIIF通过构建连续的图像表达，使用局部隐式函数进行超分辨率处理，解决了传统方法在高分辨率下的不连续问题。实验表明，LIIF在不同上采样倍数下都能保持高保真度，优于其他超分辨率方法。

摘要由CSDN通过智能技术生成

作者‖ flow
编辑‖ 3D视觉开发者社区

论文链接https://openaccess.thecvf.com/content/CVPR2021/papers/Chen_Learning_Continuous_Image_Representation_With_Local_Implicit_Image_Function_CVPR_2021_paper.pdf

代码链接： https://yinboc.github.io/liif/

一、概述

LIIF在离散2D与连续2D之间构建了桥梁，进而对图像进行分辨率调整，实现所谓的“无限放大”。通过局部的隐式图像函数对连续的图像进行表达。所谓的局部隐式表达（local implicit image Function, LIF），指函数以图像坐标以及坐标周围的二维特征作为输入，以某给定坐标处的RGB数值作为输出。由于坐标是连续的值，因此LIIF可以以任意分辨率进行表示。为了生成影像的连续表达，我们通过一个用于超分的自监督任务训练得到一个编码器。学得的连续表达就可以以任意分辨率进行超分，超分的分辨率甚至可以高达30x。换句话说，LIIF搭建了2D离散值和连续表达之间的桥梁，因此，它天然的支持GT的尺寸不一样的情况。

二、局部隐式图像函数（Local Implicit Image Function, 简称LIIF）

在LILF的表达中，将每一个连续的图像 $I^{(i)}$ 都会被表达成2D的特征图 $M^{(i)} \in \mathbb{R}^{H*W*D}$ 。解码的函数 $f_{\theta}$ 将被所有的影像共用，其参数 $\theta$ 由MLP获得，数学表达为：
$f_\theta(z,x)$
其中， $z$ 是一个向量，可以理解为隐藏的特征编码， $\in \mathcal{X}$ 是在连续影像坐标域上的一个2D的坐标， $\in \mathcal{S}$ 是预测的值，比如说RGB图上的颜色值。

MLP的python代码为：

@register('mlp')
class MLP(nn.Module):
    def __init__(self, in_dim, out_dim, hidden_list):
        super().__init__()
        layers = []
        lastv = in_dim
        for hidden in hidden_list:
            layers.append(nn.Linear(lastv, hidden))
            layers.append(nn.ReLU())
            lastv = hidden
        layers.append(nn.Linear(lastv, out_dim))
        self.layers = nn.Sequential(*layers)

    def forward(self, x):
        shape = x.shape[:-1]
        x = self.layers(x.view(-1, x.shape[-1]))
        return x.view(*shape, -1)