【读书笔记】解析深度学习:CNN原理与视觉实践
0 作者要说的话
这是小编的处女作,第一次上手写知识博客,希望以后自己每天进步一点点!
本文基于 魏秀参的《解析深度学习:卷积神经网络原理与视觉实践》 整理而成,算是一种知识积累,很多内容不会详细展开,如果有用到的内容可以再详细查,愿有所获。
1 数据扩充
深度网络需要海量数据来驱动训练,而实际上数据是稀缺的难以达到海量的程度,因此数据扩充就十分重要。有效的数据扩充不断可以扩充样本数量,而且可以增加样本多样性。这里整理几种常用且有效的数据扩充技巧。
1.1 简单方式
图像水平翻转
随机抠取
尺度变换(scaling)
旋转(rotating)
色彩抖动(color jittering)
1.2 特殊方式
1.2.1 Fancy PCA
首先对所有训练数据的R/G/B像素值进行主成分分析(PCA),得到对应的特征向量和特征值;然后根据特征向量 p i p_i pi和特征值 γ i \gamma_i γi计算一组随机值[ p 1 p_1 p1, p 2 p_2 p2, p 3 p_3 p3][ α 1 γ 1 \alpha_1\gamma_1 α1γ1, α 2 γ 2 \alpha_2\gamma_2 α2γ2, α 3 γ 3 \alpha_3\gamma_3 α3γ3,将其作为扰动加到原像素值中。(其中 α i \alpha_i αi