小白代码复现:DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders

本文详细介绍了如何复现顶会论文DDColor,包括查询论文、理解内容、收集代码、环境设置、代码实现、验证结果、调整参数和撰写报告的步骤,旨在帮助科研初学者顺利进行论文代码复现。
摘要由CSDN通过智能技术生成


前言

哈喽,大家好,本文我将来带大家复现一篇顶会论文 DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders,我将会分为两大部分来完成介绍。首先,我会带大家进行论文代码的复现操作,教会大家将代码跑起来。然后,我再来介绍论文的相关内容,便于大家更好的理解论文。这篇主要帮助大家将论文代码跑起来。(PS:本人也是科研小白,第一次进行复现论文的工作,对论文的整个理解可能也不是很到位,如有错误请大家积极指出,我会第一时间修改错误。)
论文内容介绍:小白论文复现


简要介绍

我们先简单介绍一下论文相关内容:
课题:DDColor: Towards Photo-Realistic Image Colorization via Dual Decoders
领域:计算机视觉——图像上色
会议:ICCV
作者:Xiaoyang Kang, Tao Yang, Wenqi Ouyang, Peiran Ren, Lingzhi Li, Xuansong Xie


代码复现

本人也是第一进行论文复现,我们先简要介绍一下论文复现的基本步骤(以本篇为例,带大家详细复现该篇论文代码):

1. 查询论文

我们需要利用文献检索去查询合适我们领域研究的论文(通常会选择发布在顶刊或顶会论文),然后我们去下载该论文。这里推荐大家采用专业的文献管理工具(如:EndNote、Zotero 等)来进行文献的管理。

2. 理解论文

首先我们要仔细阅读并尝试去理解原始论文,包括其中提出的问题、方法、实验设置和结果。最重要的是要清楚该篇论文的创新点(引言结尾处会给出),并根据图例去理解作者所提出的模型和方法。

3. 收集代码和数据

一般来说作者会在论文中给出开源代码,大多数都会放在Github上(本篇论文代码:https://github.com/piddnad/DDColor),我们进入网页后去下载代码,并阅读Readme部分。通常Readme会告诉我们如何去获取数据集,并告诉我们如何去使用这份代码。

4. 环境设置

我们需要在本地计算机(需要配有GPU的电脑)或云服务器上设置适当的开发环境,包括所需的软件包、库和依赖项(可以跟着视频来做)。通常使用虚拟环境(例如Python的虚拟环境或conda环境)来管理这些依赖项。如下图所示,作者告诉了我们需要配置的环境要求。

在这里插入图片描述

5. 代码重现

根据论文中描述的方法和算法,重新实现论文中的模型和实验,确保尽可能地复制论文中描述的实验设置和超参数,以及模型架构和训练过程。这对于小白来说是最困难的部分,因为大部分小白拿到代码后都会和我一样不知道从哪一步开始看代码。以我自身来说,我会先去找到参数配置部分,以便我们去设置输入输出路径和其他一些设置。然后去找到代码中的训练部分,看代码是如何进行训练的。我们来举例说明:阅读Readme部分,作者告诉了我们该如何训练。

在这里插入图片描述

  • 首先我们要下载对应的数据集,并在代码中去运行data_list/get_meta_file.py来获取数据集列表文件
  • 然后我们去下载 ConvNeXt 和 InceptionV3 的预训练权重并将其放入pretrain文件夹中。第三步作者告诉了我们,参数配置放在了options/train/train_ddcolor.yml 文件中。
  • 最后让我们运行脚本文件train.sh。

在这里我并没有直接运行该脚本文件,而是在代码中找到其对应的train.py(点击train.sh文件,我们可以看到作者设置的一些参数并在第二行最后告诉了我们路径basicsr/train.py)。之后,我的选择是在yml文件中配置好相关参数,运行train.py然后根据报错内容去相应修改代码,不会的我就会选择去百度。

在这里插入图片描述

6. 验证实现

在完成代码的实现后,我们要验证模型是否能够在所选择的数据集上运行并产生与原始论文相似的结果。进行一些简单的测试和验证,以确保实现的正确性。我们举例说明:阅读Readme部分,作者告诉了我们该如何进行验证:在这里我们可以直接运行给出的代码去下载作者训练好的模型,并告诉了我们下载路径。然后我们运行脚本文件inference.sh就可以了。

在这里插入图片描述

在这里插入图片描述

在这里我还是和之前一样,找到对应的 .py 文件。我们训练好的模型会放在experiments文件下面,然后我们进入colorization_pipeline.py 文件,找到参数配置部分,替换model_path的路径后运行即可。

在这里插入图片描述
在这里插入图片描述

7. 调整参数

根据我们的需要,可以去尝试调整模型的超参数、训练策略或其他设置,再来进行实验并尽可能地与原始结果进行比较和分析,来查看是否可以进一步优化模型的性能。

8. 撰写报告

我们可以来撰写一份报告或笔记,记录论文复现的过程、实现细节、实验结果和分析。这有助于他人理解你的工作,并为其他研究人员提供有用的参考。


  • 47
    点赞
  • 30
    收藏
    觉得还不错? 一键收藏
  • 8
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值