本次Chat的第一部分:
首先讲解如何从零基础开始阅读一篇机器学习方向的论文,以及对待论文中的数学问题。随后,从一篇经典论文入手,讲解如何快速梳理和理解一个深度学习框架及模型。
最近人工智能和机器学习方向的论文非常多,那么一个有工程背景、学术经验较少或者有一定经验的工程师,如何阅读一篇人工智能相关的论文呢?
在刚开始的学术探索中,我倾向于全文精读,尤其是深度学习领域的经典论文,但发现这种方式花费时间太多,以至于挤压了我的真正目的——工程实现和工程结合。并且,因为想抓住的东西太多,反而没有抓住一篇文章的核心,导致很容易忘记,比如昨天读的文章就像喝了水一样忘掉了。
我将和大家从两个方面探讨。
一、从零开始,阅读一篇论文的层次
这里的从零开始,指的是我们要从零了解这篇文章做了什么事情、使用了什么方法、得到什么结果,这样的方法和结果对我有没有什么借鉴。
而不是说,接触到一个全新的领域,从读论文开始入手。对于没有过接触的陌生领域。我的方法是,先看中文综述,中文博士论文,而后是英文综述。通过中文综述,可以首先了解这个领域的基本名词、实验常用方法。否则直接从论文入手的话,作者站的高度和我们的水平不一致,很容易想当然的理解或者根本看不下去。因此,在阅读这篇文章之前,对于这篇文章中涉及到的基础知识,对应中文基础都理解透彻。
这时,回归到从零开始理解这篇文章的状态。
对一篇文章的阅读往往有3个递增的层次:
层次1. 读懂这篇文章的概要信息(5-10分钟)
认真读懂标题、摘要、简介(title, abstract, and introduction)。
只读各个部分和子部分(section and sub-section)的标题,跳过具体内容。
读懂结论和讨论(作者通常会在这里论述本研究的不足和缺失,为未来的研究提供建议,指明方向)。
浏览参考文献,记下哪些文献是你已经读过的。
因此,在第一层次过后,应该能回答出以下5个问题: