对L1,L2正则化的理解 L1,L2都可以通过约束参数降低剧烈波动来防止过拟合。 而L1正则化可以产生稀疏模型,进而可以用于特征选择,所以L1适用于特征之间有关联的情况。 L2让所有特征的系数都缩小,但不会减为0,它会使优化求解稳定快速,所以L2适用于特征之间没有关联的情况。