程序人生 | (5) 吴恩达:关于机器学习职业生涯以及阅读论文的一些建议

原文链接

本文总结了斯坦福大学CS230深度学习课程在YouTube上的演讲:对职业发展的一些建议以及阅读研究论文的方法。视频链接

Andrew特别提出两项主要建议:

1)阅读研究论文:他使用的非常有效的技巧,当他试图在深度学习中掌握一个新主题时,他会阅读研究论文。

2)在机器学习领域开创事业的建议。

目录

1. 读研究论文

2. 如何读论文?

3. 理解一篇论文需要花多少时间?

4. 论文的来源

5. 代码练习

6. 持续进步

7. 招聘人员要的是什么?

8. 一些通用的建议

9. 总结


1. 读研究论文

你如何通过阅读研究论文来高效和相对快速地学习?所以,如果你想从学术文献中学习,你应该做什么,无论是你想学习建立一个感兴趣的机器学习系统/项目,还是仅仅停留在事情的顶端,获得更多的知识,成为一个深入学习的人

1)编写一份论文列表:尝试创建一份研究论文列表、包括你拥有的任何文本或学习资源。

2)过一遍列表:基本上,你应该以一种并行的方式阅读研究论文,意思是一次处理多篇论文。具体地说,试着快速浏览并理解每一篇文章,而不是全部读完,也许你读了每一篇文章的10-20%,也许这足以让你对手头的文章有一个高水平的理解。在那之后,你可能会决定删除其中的一些论文,或者只是浏览一两篇论文,把它们通读一遍。

他还提到,如果你读到:

1)5-20篇论文(在选择的领域,比如语音识别)=>这可能是足够的知识,你可以实现一个语音识别系统,但可能不够研究或让你处于前沿。

2)50-100篇论文=>你可能会对这个领域的应用(语音识别)有很好的理解。

 

2. 如何读论文?

不要从头读到尾。相反,需要多次遍历论文,下面是具体如何做的:

1)阅读文章标题、摘要和图:通过阅读文章标题、摘要、关键网络架构图,或许还有实验部分,你将能够对论文的概念有一个大致的了解。在深度学习中,有很多研究论文都是将整篇论文总结成一两个图形,而不需要费力地通读全文。

2)读介绍+结论+图+略过其他:介绍、结论和摘要是作者试图仔细总结自己工作的地方,以便向审稿人阐明为什么他们的论文应该被接受发表。此外,略过相关的工作部分(如果可能的话),这部分的目的是突出其他人所做的工作,这些工作在某种程度上与作者的工作有关。因此,阅读它可能是有用的,但如果你不熟悉这个主题,有时很难理解。

3)通读全文但跳过数学部分。

4)通读全文,但略过没有意义的部分:出色的研究意味着我们发表的东西是在我们的知识和理解的边界上。

他还解释说,当你阅读论文时(即使是最有影响力的论文),你可能也会发现有些部分没什么用,或者没什么意义。因此,如果你读了一篇论文,其中一些内容没有意义(这并不罕见),那么你可以先略读。除非你想要掌握它,那就花更多的时间。

当你阅读一篇论文时,试着回答以下问题:

1)作者试图完成什么

2)这个方法的关键要素是什么

3)你自己能做什么

4)你还想要什么其他的参考资料

如果你能回答这些问题,就很有希望的能反映出你对论文有很好的理解。

事实证明,当你读更多的论文时,通过练习你会变得更快。因为,很多作者在写论文时使用的是通用格式。

例如,这是作者用来描述网络架构的一种常见格式,特别是在计算机视觉中:

 

3. 理解一篇论文需要花多少时间?

对于刚接触机器学习的人来说,理解一篇相对简单的论文可能需要一个小时,这并不罕见。但是,有时你可能会偶然发现需要3个小时甚至更长时间才能真正理解的论文。

 

4. 论文的来源

网上有很多很棒的资源。例如,如果你是新手,列出语音识别领域中最重要的论文的博客文章将非常有用。

随着深度学习的快速发展,很多人都试图跟上它的最新进展。所以,你应该这样做:

1)Twitter:令人惊讶的是,Twitter正成为研究人员发现新事物的重要场所。或微博,比如:爱可可爱生活等

2)微信公众号:AI 有道、量子位、PaperWeekly、深度学习自然语言处理、机器学习算法与自然语言处理

3)重要机器学习、深度学习、自然语言处理会议:NLPS/ICML/ICLR/SIGIR/ICDM/ACL/EMNLP/NAACL/Coling/EACL/CoNLL

4)朋友:找一个对该领域感兴趣的社区或一群朋友,分享有趣的研究论文。

更加深入的理解文中的数学部分

试着从头开始重新推导。虽然,这需要一些时间,但这是一个很好的练习。

 

5. 代码练习

1)下载开源代码(如果你能找到的话)并运行它。

2)从头开始重新实现:如果你能够做到这一点,那么这是一个强烈的信号,表明你已经真正理解了手头的算法。

 

6. 持续进步

最重要的是不断学习,变得更好是指更加稳定的学习,而不是集中一段时间内读大量的论文。与其在短时间内死记硬背,不如从明年开始每周读两篇论文。

 

7. 招聘人员要的是什么?

1)机器学习能力。

2)有意义的工作:表明你能胜任这份工作的项目。

对于成功的机器学习工程师(优秀的求职者)来说,一个非常常见的模式是开发一个T型知识库。意思是对人工智能中许多不同的主题有广泛的理解,并在至少一个领域有非常深刻的理解。

  • 构建横向能力

在这些领域建立基本技能的一个非常有效的方法是通过课程和阅读研究论文。

  • 构建纵向能力

你可以通过做相关的项目、开源贡献、研究和实习来构建它。

  • 选择一份工作

如果你想不断学习新东西,下面是影响你成功的一些因素:

1)无论你是和伟大的人/项目一起工作:被勤奋的人包围会影响你。

2)除了经理之外,还要关注你将与之共事的团队(10-30人,你将与他们互动最多),并对他们进行评估。

3)不要关注“品牌”:公司的品牌与你的个人经历并没有太大的关联。

所以,如果你得到了一份工作,问问你将和哪个团队一起工作,不要接受“加入我们,之后我们会组建一个团队”的工作邀请,因为你可能会和一个团队一起做你不感兴趣的事情,这不利于自己有效地进化。

另一方面,如果你能找到一个好的团队(即使是在一家不知名的公司)并加入他们,你实际上可以学到很多东西。

 

8. 一些通用的建议

1)学得最多:倾向于选择能让你学到最多东西的工作。

2)做重要的工作:从事有价值的项目,推动世界向前发展。

3)尝试将机器学习带到传统行业:我们在科技行业已经改变了很多,但我认为最令人兴奋的工作之一可能是在传统行业(科技行业之外),因为你可以在那里创造更多的价值。

 

9. 总结

1)养成阅读研究论文的习惯:每周阅读两篇论文作为开始。

2)高效阅读:编制一份论文清单,一次并行阅读多篇论文,每篇论文都要经过多次阅读。

3)阅读论文时:首先阅读题目/摘要/图表(尤其是)/引言/结论。

4)尝试理解算法时:尝试重新推导数学并通过重新实现来练习编程。

5)尽量掌握最新信息,通过查看ML会议和其他在线资源中的资料。

6)在AI中构建一个t型知识库。

7)尝试加入一个好的团队(在大公司或初创公司),这将帮助你高效成长。

8)从事有用的项目可以帮助你学到更多,推动世界前进。

9)尝试将机器学习应用到其他行业:医疗、天文学、气候变化等。

 

1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。 1、资源项目源码均已通过严格测试验证,保证能够正常运行; 2、项目问题、技术讨论,可以给博主私信或留言,博主看到后会第一时间与您进行沟通; 3、本项目比较适合计算机领域相关的毕业设计课题、课程作业等使用,尤其对于人工智能、计算机科学与技术等相关专业,更为适合; 4、下载使用后,可先查看README.md或论文文件(如有),本项目仅用作交流学习参考,请切勿用于商业用途。 5、资源来自互联网采集,如有侵权,私聊博主删除。 6、可私信博主看论文后选择购买源代码。
应用背景为变电站电力巡检,基于YOLO v4算法模型对常见电力巡检目标进行检测,并充分利用Ascend310提供的DVPP等硬件支持能力来完成流媒体的传输、处理等任务,并对系统性能做出一定的优化。.zip深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
深度学习是机器学习的一个子领域,它基于人工神经网络的研究,特别是利用多层次的神经网络来进行学习和模式识别。深度学习模型能够学习数据的高层次特征,这些特征对于图像和语音识别、自然语言处理、医学图像分析等应用至关重要。以下是深度学习的一些关键概念和组成部分: 1. **神经网络(Neural Networks)**:深度学习的基础是人工神经网络,它是由多个层组成的网络结构,包括输入层、隐藏层和输出层。每个层由多个神经元组成,神经元之间通过权重连接。 2. **前馈神经网络(Feedforward Neural Networks)**:这是最常见的神经网络类型,信息从输入层流向隐藏层,最终到达输出层。 3. **卷积神经网络(Convolutional Neural Networks, CNNs)**:这种网络特别适合处理具有网格结构的数据,如图像。它们使用卷积层来提取图像的特征。 4. **循环神经网络(Recurrent Neural Networks, RNNs)**:这种网络能够处理序列数据,如时间序列或自然语言,因为它们具有记忆功能,能够捕捉数据中的时间依赖性。 5. **长短期记忆网络(Long Short-Term Memory, LSTM)**:LSTM 是一种特殊的 RNN,它能够学习长期依赖关系,非常适合复杂的序列预测任务。 6. **生成对抗网络(Generative Adversarial Networks, GANs)**:由两个网络组成,一个生成器和一个判别器,它们相互竞争,生成器生成数据,判别器评估数据的真实性。 7. **深度学习框架**:如 TensorFlow、Keras、PyTorch 等,这些框架提供了构建、训练和部署深度学习模型的工具和库。 8. **激活函数(Activation Functions)**:如 ReLU、Sigmoid、Tanh 等,它们在神经网络中用于添加非线性,使得网络能够学习复杂的函数。 9. **损失函数(Loss Functions)**:用于评估模型的预测与真实值之间的差异,常见的损失函数包括均方误差(MSE)、交叉熵(Cross-Entropy)等。 10. **优化算法(Optimization Algorithms)**:如梯度下降(Gradient Descent)、随机梯度下降(SGD)、Adam 等,用于更新网络权重,以最小化损失函数。 11. **正则化(Regularization)**:技术如 Dropout、L1/L2 正则化等,用于防止模型过拟合。 12. **迁移学习(Transfer Learning)**:利用在一个任务上训练好的模型来提高另一个相关任务的性能。 深度学习在许多领域都取得了显著的成就,但它也面临着一些挑战,如对大量数据的依赖、模型的解释性差、计算资源消耗大等。研究人员正在不断探索新的方法来解决这些问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值