深度学习正则化 参数范数惩罚L2参数正则化L1参数正则化 参数绑定和参数共享噪声注入和数据扩充稀疏表征早停dropout 参数范数惩罚 L2参数正则化 L1参数正则化 L1正则化的限制更为严格,也就更加的稀疏。稀疏性的一大好处就是特征选择。 参数绑定和参数共享 噪声注入和数据扩充 稀疏表征 L1是参数稀疏 表征稀疏:隐藏层的输出大多数为零或接近零 早停 dropout