深度学习和计算机视觉的一些思考和总结

最新推荐文章于 2024-06-27 16:12:22 发布

百科全书学派

最新推荐文章于 2024-06-27 16:12:22 发布

阅读量1.1k

点赞数 1

分类专栏：算法

本文链接：https://blog.csdn.net/load2006/article/details/86547335

版权

作者分享了一年多来在深度学习和计算机视觉领域的学习与工作经验，从接触深度学习开始，通过阅读《deep learning book》对理论进行深入，认为该书更适合学术研究而非工程实践。在实践中，发现传统视觉算法相对易入门，而深度学习的重点在于模型训练的诸多可变因素。尽管深度学习在某些方面取得突破，但在定位和跟踪等问题上仍有不足，且在性能消耗上较大。作者指出，视觉技术在商业落地中存在广泛但非迫切的情况，目前主要应用在人脸识别、刷脸支付等领域，而自动驾驶是可能带来颠覆性变革的领域。

摘要由CSDN通过智能技术生成

做视觉和算法也有一年多了，是时候做一些必要的思考和总结。

最初接触深度学习是这样的，老大打算做一个深度学习框架在云环境下自动化部署的一个项目。之前对云这块还比较熟悉，误打误撞开始接触前段比较火的深度学习领域。这个任务还是比较简单的，只要把一个深度学习训练任务的各个步骤串联起来放到kubernetes里面run起来就ok了。对深度学习训练的一些基本知识有了初步的印象，随机梯度下降，epoch，同步训练，参数服务器，等等。理解这些不需要太多专业领域知识。不过自己并不甘心与此，想拿些基础知识做下补充。结果一下子把自己带到坑里面去了。怎么进坑的呢，就是把good fellow写的《deep learning book》看起来了。

现在要我总结起来，《deep learning book》这本书，对于搞工程的人来说，没必要看，这本书主要受众还是有做学术倾向的的人，并不适合工业界的人做入门。我上来先把前几章的数学基础补充了下。之前看过李航老师的《统计学习方法》，因为里面没怎么写数学基础知识，对于SVM、PCA等公式推导看的不太明白。所以拿到《deep learning book》感觉如果至宝。现在的结论是，前几章里面讲线性代数的部分还是有必要熟悉下，关于矩阵的知识分非常基础，几乎涉及到了全领域所有部分。但是对于统计相关的只是，倒是没必要一开始就深入那么多。因为本人是数学系出身，对理论和抽象的东西比较敏感。所以开始的时候花了很大的经历去理解贝叶斯统计，现在想想意识必要性不太高，而是这部分需要一段时间的积累，不是短时间内能理解的很深。另外，如果是做视觉，对贝叶斯统计这块可以不看的，如果是要搞NLP或者传统机器学习中概率图模型（时间序列分析），还是要把一些基础概