TPAMI 2025 | 图像超分新范式:LTPE 以局部纹理分布约束,兼顾视觉质量与参数效率

点击上方“小白学视觉”,选择加"星标"或“置顶”
重磅干货,第一时间送达

在图像超分辨率(SR)领域,高频纹理的精准恢复始终是核心挑战。传统方法要么因依赖像素级损失导致纹理过度平滑,要么因采用生成对抗网络(GAN)引发虚假纹理与参数冗余问题。近期发表于TPAMI 2025的论文《Local Texture Pattern Estimation for Image Detail Super-Resolution》提出了一种全新解决方案,通过局部纹理模式估计(LTPE)策略,在不使用GAN的情况下实现了逼真纹理的高效恢复。本文将系统解析该方法的技术框架与实验成果。

论文信息

题目:Local Texture Pattern Estimation for Image Detail Super-Resolution
基于局部纹理模式估计的图像细节超分辨率
作者:Fan Fan, Yang Zhao, Yuan Chen, Nannan Li, Wei Jia, Ronggang Wang

研究背景:纹理恢复的两难困境

单图像超分辨率(SISR)的核心目标是从低分辨率(LR)图像中重建高分辨率(HR)内容,其中高频纹理的还原直接决定视觉质量。现有方法存在显著局限:

  • 传统深度学习模型:基于L1/L2损失的逐像素优化虽能保持边缘清晰,但会平均化随机高频成分,导致纹理模糊(图2展示了边缘与纹理的结构差异)。

  • GAN-based方法:通过对抗损失提升纹理逼真度,但全局语义约束宽松易产生虚假纹理,且模型参数规模庞大(如ESRGAN参数量达数百万)。

  • 传统纹理增强策略:如反投影(BP)或字典学习,因依赖人工参数调整或过度关注稳定边缘,难以持续提升纹理质量。

论文观察到HR与LR图像的局部二值模式(LBP)存在显著差异(图1):HR图像的LBP图包含丰富高频变化,而LR插值图像的LBP图则呈现平滑分布。这一发现为基于纹理结构先验的恢复策略提供了关键启发。

HR与LR图像的LBP特征差异图1:HR图像(上)与LR插值图像(下)的LBP特征对比,可见HR图像具有更丰富的局部纹理变化

核心方法:基于LTPE的双分支协同框架

论文提出的方法通过三个关键组件实现纹理增强:可微的LTPE模块、纹理增强分支与纹理融合SR分支,整体采用双分支架构(图5),在保持轻量级特性的同时实现精准纹理恢复。

1. 可微局部纹理模式估计(LTPE)模块

传统LBP算子因含不可微符号函数,无法直接嵌入神经网络。LTPE模块通过改进设计实现端到端训练:

  • 核心原理:采用8个3×3微分卷积核(中心值为1,邻域值为-1)模拟局部像素差异比较,通过加权求和与实例归一化(IN)生成纹理描述图(图6)。

  • 优势:相比LBP,LTPE能更精准地聚焦真实纹理区域,抑制平滑区域的噪声响应(图7)。例如在平坦区域,LBP可能误判高频变化,而LTPE通过连续值输出避免了二值化的粗糙性。

LBP与LTPE的纹理表征对比图7:从左至右依次为原图、LBP图、LTPE图,可见LTPE对纹理区域的识别更精准

2. 双分支架构设计

(1)纹理增强分支

接收LR图像的LTPE图作为输入,通过4个局部纹理增强块(LTEB)重建HR级别的纹理模式。每个LTEB采用残差结构,专注于恢复毛发、树叶等高频细节(图7中d→e的增强效果)。该分支通过学习局部纹理分布规律,避免了GAN生成的随机性。

(2)纹理融合SR分支

以LR图像为输入,通过4个纹理融合增强块(TFEB)整合图像特征与纹理特征。关键创新在于纹理转移层(TTLayer)

  • 先将增强后的纹理特征作为高频残差注入图像特征

  • 通过可调节系数λ控制注入强度(实验验证0.2为最优值)

  • 采用卷积层融合双通道特征,避免直接拼接导致的域差异问题

最终通过2个残差局部特征块(RLFB)与上采样模块生成SR结果。

方法总体框架图5:双分支架构示意图,左侧为纹理增强分支,右侧为融合SR分支,两者通过纹理转移层协同工作

3. 多损失函数优化策略

为平衡纹理逼真度与结构一致性,采用四项损失加权组合:

  • L1损失:约束像素级一致性,抑制整体失真

  • Gram损失:通过VGG特征的Gram矩阵匹配,增强局部纹理多样性

  • 纹理L1损失:确保预测LTPE图与真实值的一致性

  • 纹理Gram损失:优化纹理特征的分布特性

这种组合既避免了单一损失导致的平滑效应,又通过纹理约束防止高频噪声污染。

实验验证:性能与泛化性分析

1. 实验设置

  • 数据集:DIV2K训练集(800张2K图像),7个测试集(Urban100、OST300等)

  • 退化模型:4倍下采样+双三次插值(最大化高频信息损失)

  • 评价指标:同时采用传统指标(PSNR、SSIM)与感知指标(PI、LPIPS、DISTS等)

2. 与SOTA方法的对比

(1)非GAN方法对比

在Urban100等数据集上,所提方法在感知指标上显著领先:

  • PI(感知指数)提升12-18%,LPIPS(感知相似度)降低15-20%

  • 主观对比显示(图10),在毛发、建筑细节等纹理密集区域,恢复效果远超RLFN、SwinIR等方法

与非GAN方法的纹理恢复对比图10:非GAN方法对比(从左至右:LR、GT、所提方法、RLFN、SwinIR),所提方法的纹理细节更丰富

(2)GAN方法对比

与ESRGAN、RealESRGAN等相比:

  • 客观指标:LPIPS与DISTS值相当,但参数规模减少60%以上

  • 主观质量:在砖块、毛发等纹理上(图9),所提方法避免了GAN常见的结构失真(如砖块排列紊乱)

与GAN方法的纹理真实性对比图9:GAN方法对比(左:GT,中:ESRGAN,右:所提方法),可见所提方法的纹理结构更贴合真实

(3)用户研究

18名观察者对10组图像的评分显示,所提方法的平均意见得分(MOS)比次优方法高0.3-0.5分,验证了其视觉感知优势。

3. 消融实验

关键组件的有效性验证:

  • 纹理转移层:去除后LPIPS值下降11.3%,证明其在特征融合中的关键作用

  • LTPE模块:替换为LBP后,纹理错误率增加23%

  • Gram损失:单独使用会引入噪声,与LTPE结合后可提升感知质量

创新价值与未来方向

该研究的核心贡献在于:

  1. 理论突破:提出"以纹理导纹理"的非生成式策略,为纹理恢复提供新范式

  2. 工程设计:可微LTPE模块与纹理转移层的设计,实现了纹理特征的有效嵌入

  3. 性能平衡:在参数规模(仅为ESRGAN的1/3)与纹理质量间取得优异平衡

局限性方面,该方法在PSNR等传统指标上略有妥协。未来可通过以下方向改进:

  • 结合生成模型,为纹理区域与边缘结构设计差异化损失

  • 探索与AIGC模型的融合,利用大模型先验优化纹理一致性

该研究为超分辨率领域提供了一条摆脱GAN依赖的新路径,其局部纹理结构约束的思路也可扩展至图像修复、风格迁移等任务,具有重要的学术与应用价值。

下载1:OpenCV-Contrib扩展模块中文版教程

在「小白学视觉」公众号后台回复:扩展模块中文教程,即可下载全网第一份OpenCV扩展模块教程中文版,涵盖扩展模块安装、SFM算法、立体视觉、目标跟踪、生物视觉、超分辨率处理等二十多章内容。


下载2:Python视觉实战项目52讲
在「小白学视觉」公众号后台回复:Python视觉实战项目,即可下载包括图像分割、口罩检测、车道线检测、车辆计数、添加眼线、车牌识别、字符识别、情绪检测、文本内容提取、面部识别等31个视觉实战项目,助力快速学校计算机视觉。


下载3:人工智能0基础学习攻略手册
在「小白学视觉」公众号后台回复:攻略手册,即可获取《从 0 入门人工智能学习攻略手册》文档,包含视频课件、习题、电子书、代码、数据等人工智能学习相关资源,可以下载离线学习。


交流群

欢迎加入公众号读者群一起和同行交流,目前有SLAM、三维视觉、传感器、自动驾驶、计算摄影、检测、分割、识别、医学影像、GAN、算法竞赛等微信群(以后会逐渐细分),请扫描下面微信号加群,备注:”昵称+学校/公司+研究方向“,例如:”张三 + 上海交大 + 视觉SLAM“。请按照格式备注,否则不予通过。添加成功后会根据研究方向邀请进入相关微信群。请勿在群内发送广告,否则会请出群,谢谢理解~
源码地址: https://pan.quark.cn/s/d1f41682e390 miyoubiAuto 米游社每日米游币自动化Python脚本(务必使用Python3) 8更:更换cookie的获取地址 注意:禁止在B站、贴吧、或各大论坛大肆传播! 作者已退游,项目不维护了。 如果有能力的可以pr修复。 小引一波 推荐关注几个非常可爱有趣的女孩! 欢迎B站搜索: @嘉然今天吃什么 @向晚大魔王 @乃琳Queen @贝拉kira 第三方库 食用方法 下载源码 在Global.py中设置米游社Cookie 运行myb.py 本地第一次运行时会自动生产一个文件储存cookie,请勿删除 当前仅支持单个账号! 获取Cookie方法 浏览器无痕模式打开 http://user.mihoyo.com/ ,登录账号 按,打开,找到并点击 按刷页面,按下图复制 Cookie: How to get mys cookie 当触发时,可尝试按关闭,然后再次刷页面,最后复制 Cookie。 也可以使用另一种方法: 复制代码 浏览器无痕模式打开 http://user.mihoyo.com/ ,登录账号 按,打开,找到并点击 控制台粘贴代码并运行,获得类似的输出信息 部即为所需复制的 Cookie,点击确定复制 部署方法--腾讯云函数版(推荐! ) 下载项目源码和压缩包 进入项目文件夹打开命令行执行以下命令 xxxxxxx为通过上面方式或取得米游社cookie 一定要用双引号包裹!! 例如: png 复制返回内容(包括括号) 例如: QQ截图20210505031552.png 登录腾讯云函数官网 选择函数服务-建-自定义创建 函数名称随意-地区随意-运行环境Python3....
评论
成就一亿技术人!
拼手气红包6.0元
还能输入1000个字符
 
红包 添加红包
表情包 插入表情
 条评论被折叠 查看
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

小白学视觉

您的赞赏是我们坚持下去的动力~

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值