自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(7)
  • 收藏
  • 关注

原创 UVE-NET代码分析 ———sr——model.py, tramsform.py,gopro_dataset.py

EMA 是一种提升模型泛化能力的训练技巧,通过对网络参数的 “移动平均” 生成一个更稳定的 “影子网络”(net_g_ema),测试时用该影子网络推理,可减少参数抖动带来的误差。

2025-09-29 17:53:12 1528

原创 UVE-NET代码分析 ——video_quality_enhancer.py

基于 Basicsr 框架实现的视频质量增强主模型(VideoQualityEnhancer),核心功能是整合训练流程(数据加载、损失计算、参数优化)、验证流程(PSNR 评估、结果保存)。该模型继承自 Basicsr 的VideoBaseModel,是连接 “网络架构(VideoQualityEnhancerArch)” 与 “训练 / 验证流程” 的桥梁。

2025-09-28 19:18:21 633

原创 UVE-NET代码分析 ——video_quality_enhancer_arch.py

整合了时空特征提取、多尺度编码解码、Swin Transformer 全局特征建模与多特征融合模块。网络采用模块化串联 + 特征融合的设计,输入为连续视频帧((batch, 帧数, 通道, 高, 宽)),输出为增强后的视频帧及下采样版本。输入视频帧 → 时空特征提取 → 多尺度编码解码 → Swin全局特征提取 → 三类特征拼接 → 特征融合 → 增强输出+下采样输出模块名称核心功能捕捉视频帧间的时空关联性(如运动信息)提取多尺度局部特征,确保尺寸无损恢复。

2025-09-28 18:29:41 1691

原创 UVE-NET代码分析 ——train.py

train.py主要用于视频质量增强。它实现了完整的训练流程,包括数据加载、模型构建、训练循环、日志记录、断点续训等功能。

2025-09-28 17:18:43 729

原创 UVE-NET代码分析 —— basicsr文件夹之arch部分(二)

arch是存放网络架构(Neural Network Architectures)相关的代码。各种用于图像超分辨率、修复的深度学习模型结构,是整个算法的 “骨架” 部分,决定了模型如何提取和处理图像特征。

2025-09-13 17:21:10 869

原创 UVE-NET代码分析 —— basicsr文件夹之arch部分(一)

arch是存放网络架构(Neural Network Architectures)相关的代码。各种用于图像超分辨率、修复的深度学习模型结构,是整个算法的 “骨架” 部分,决定了模型如何提取和处理图像特征。声明当前模块对外公开的接口只有 build_network 函数,其他内容(如动态导入的模块)不对外暴露。

2025-09-12 11:29:59 629

原创 UVE-NET代码分析 —— 项目目录解析

模型封装目录,将 archs 中的网络架构、losses 中的损失函数等整合,形成完整的 “模型类”,方便训练和推理时调用(比如包含模型前向传播、损失计算、参数更新等逻辑)。:操作 / 算子目录,存放自定义的底层操作(比如特殊的卷积、上采样、注意力机制等),补充 PyTorch 等框架原生算子的不足,适配超分任务的特殊需求。:模型训练脚本,整合 data(数据)、models(模型)、losses(损失)等模块,实现模型的训练流程。:损失函数目录,定义超分辨率任务中使用的损失,指导模型的训练优化方向。

2025-09-10 20:36:10 1798

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除