1 L1正则化和L2正则化区别 L1得到的是稀疏权值,可以用于特征选择,假设参数服从Laplace分布(贝叶斯角度理解) L2得到的是平滑权值,因为所有权值都趋于最小,假设参数服从Gauss分布,(并趋于一致,因为一致时平方和,最小) 2 L1正则化稀疏解理解 2.1问题转化 2.2图形化解释