【How2Research（一）】深度学习方向的论文有 idea，如何工程实现？

多恩Stone

已于 2024-06-25 11:02:49 修改

阅读量981

点赞数 28

分类专栏：科研计算机视觉入门 AIGC 文章标签：深度学习人工智能 pytorch python AIGC ide

于 2024-06-25 11:00:52 首次发布

本文链接：https://blog.csdn.net/weixin_44212848/article/details/139951775

版权

51 篇文章 2 订阅

订阅专栏

31 篇文章 0 订阅

订阅专栏

18 篇文章 0 订阅

订阅专栏

前言

在刚接触深度学习时，不要急于自己写代码。可以从众多论文中挑选一到两篇作为 Baseline。这些Baseline应该具备以下特点：

开源代码和完整文档：确保论文提供了开源代码和详细的文档（如README）。如果代码在GitHub上的星数较多（最好 200+ star），说明有较多用户使用和认可。
最近发表：选择发表时间在近两到三年的论文，避免使用过时的代码和框架。
清晰的公式：论文中的公式应清晰明了，方便你将理论转化为代码。当明白了如何把理论的公式转化为代码时，基本就上道了。

找到合适的Baseline论文后，开始深入阅读和使用其代码。提高代码能力的最好方法是阅读别人写的优质代码。具体步骤如下：

配置环境：按照GitHub文档配置好开发环境。现在配置环境相对简单，PyTorch和TensorFlow都很易用。
运行代码：根据README下载数据并运行脚本，确保训练流程能顺利跑通。若出现错误，通常是库版本不兼容导致的。
调试代码：使用 IDE（如PyCharm，VsCode）进入调试 Debug 模式，逐步查看代码，结合论文和API文档理解每一步的实现。重点看每步的输入输出形状或值。通过这种方式，你会对深度学习的完整流程有更深入的认识。

建议多跑几遍不同的Baseline代码，并记录下大概流程。

经过上述步骤后，你已经对深度学习的训练和预测流程有了较为清晰的认识。现在可以开始将自己的想法加入Pipeline中。通常，这包括提出更好的模型或训练机制。

关注