范数一般当做距离来理解。过拟合问题的通俗理解就是泛化能力过强,在最小化误差的同时使模型尽可能的拟合训练数据,学习的特征越多,模型的复杂度越高,测试时的误差也就越大。像决策树的叶子结点越多,这时我们就要剪枝啦。而L1、L2范数就是在使模型变得简单。
L1
数学角度,L1范数表示向量x中非零元素的绝对值之和。抽象得很!
深度学习角度,L1范数表示成
在最小化误差时,将L1或者L2范数作为正则化项,与误差项一同求最优。L1要做的事情就是使模型参数稀疏化
范数一般当做距离来理解。过拟合问题的通俗理解就是泛化能力过强,在最小化误差的同时使模型尽可能的拟合训练数据,学习的特征越多,模型的复杂度越高,测试时的误差也就越大。像决策树的叶子结点越多,这时我们就要剪枝啦。而L1、L2范数就是在使模型变得简单。
数学角度,L1范数表示向量x中非零元素的绝对值之和。抽象得很!
深度学习角度,L1范数表示成
在最小化误差时,将L1或者L2范数作为正则化项,与误差项一同求最优。L1要做的事情就是使模型参数稀疏化