【How2Research(一)】深度学习方向的论文有 idea,如何工程实现?


前言

  • 该系列将收集整理各科研大佬的 Research 方法论。
  • 本文为 知乎上高赞回答 的总结梳理,并制作脑图如下,以便于理解消化。

新手基于 baseline
熟练后从头搭 pipeline
Step1: 选 baseline 论文
1.1 有开源代码
1.2 发表时间近2-3年
1.3 论文公式清晰
Step2: 深入 baseline 代码
2.1 配置环境
Step3: 搭建自己的 pipeline
2.2 下数据,跑通训练代码
2.3 一步步 debug 运行代码
改数据读取和预处理并跑通
Step4: 将新的核心算法融入 pipeline
数据I/O,预处理,模型,loss,训练,验证,测试等

一、选择 Baseline 论文

在刚接触深度学习时,不要急于自己写代码。可以从众多论文中挑选一到两篇作为 Baseline。这些Baseline应该具备以下特点:

  1. 开源代码和完整文档:确保论文提供了开源代码和详细的文档(如README)。如果代码在GitHub上的星数较多(最好 200+ star),说明有较多用户使用和认可。
  2. 最近发表:选择发表时间在近两到三年的论文,避免使用过时的代码和框架。
  3. 清晰的公式:论文中的公式应清晰明了,方便你将理论转化为代码。当明白了如何把理论的公式转化为代码时,基本就上道了。

二、深入阅读 Baseline 代码

找到合适的Baseline论文后,开始深入阅读和使用其代码。提高代码能力的最好方法是阅读别人写的优质代码。具体步骤如下:

  1. 配置环境:按照GitHub文档配置好开发环境。现在配置环境相对简单,PyTorch和TensorFlow都很易用。
  2. 运行代码:根据README下载数据并运行脚本,确保训练流程能顺利跑通。若出现错误,通常是库版本不兼容导致的。
  3. 调试代码:使用 IDE(如PyCharm,VsCode)进入调试 Debug 模式,逐步查看代码,结合论文和API文档理解每一步的实现。重点看每步的输入输出形状或值。通过这种方式,你会对深度学习的完整流程有更深入的认识。

建议多跑几遍不同的Baseline代码,并记录下大概流程。

三、搭建自己的Pipeline

  1. 对于初学者:可以选择一个好的Baseline作为基础代码,并在其上进行修改。首先修改数据读取和预处理部分,确保Baseline的模型能在你的数据上正常运行。
  2. 熟练后:可以根据特定任务从头搭建整个Pipeline,包括数据I/O、预处理、模型搭建、损失函数定义、训练与验证、测试等。

四、融入自己的算法

经过上述步骤后,你已经对深度学习的训练和预测流程有了较为清晰的认识。现在可以开始将自己的想法加入Pipeline中。通常,这包括提出更好的模型训练机制

  1. 模型搭建:在网上找到类似架构的代码作为参考,例如做轻量级图像分割时可以借鉴UNet。
  2. 测试模型:在将模型加入Pipeline前,先用随机的Tensor进行推理,检查输出的形状是否正确。
  • 28
    点赞
  • 14
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值