做视觉和算法也有一年多了,是时候做一些必要的思考和总结。
最初接触深度学习是这样的,老大打算做一个深度学习框架在云环境下自动化部署的一个项目。之前对云这块还比较熟悉,误打误撞开始接触前段比较火的深度学习领域。这个任务还是比较简单的,只要把一个深度学习训练任务的各个步骤串联起来放到kubernetes里面run起来就ok了。对深度学习训练的一些基本知识有了初步的印象,随机梯度下降,epoch,同步训练,参数服务器,等等。理解这些不需要太多专业领域知识。不过自己并不甘心与此,想拿些基础知识做下补充。结果一下子把自己带到坑里面去了。怎么进坑的呢,就是把good fellow写的《deep learning book》看起来了。
现在要我总结起来,《deep learning book》这本书,对于搞工程的人来说,没必要看,这本书主要受众还是有做学术倾向的的人,并不适合工业界的人做入门。我上来先把前几章的数学基础补充了下。之前看过李航老师的《统计学习方法》,因为里面没怎么写数学基础知识,对于SVM、PCA等公式推导看的不太明白。所以拿到《deep learning book》感觉如果至宝。现在的结论是,前几章里面讲线性代数的部分还是有必要熟悉下,关于矩阵的知识分非常基础,几乎涉及到了全领域所有部分。但是对于统计相关的只是,倒是没必要一开始就深入那么多。因为本人是数学系出身,对理论和抽象的东西比较敏感。所以开始的时候花了很大的经历去理解贝叶斯统计,现在想想意识必要性不太高,而是这部分需要一段时间的积累,不是短时间内能理解的很深。另外,如果是做视觉,对贝叶斯统计这块可以不看的,如果是要搞NLP或者传统机器学习中概率图模型(时间序列分析),还是要把一些基础概