本人对于正则化l1和l2的理解:
首先,什么是L1,L2正则化:
L1正则化就是对各个特征系数的绝对值之和;
L2正则化就是对各个特征系数的平方和再求平方根;
L1,L2正则化有什么作用?
一般来说:
L1:
L1可以通过构建稀疏权重矩阵来进行特征选择。一般来说,我们在进行特种选择时,特征过多,有的特征特别稀疏,对于那些稀疏的特征,其实对于总的特征选择而言影响并不大,所以,为了选择关键特征,可以l1来对那些系数特征进行过滤,使用l1构造系数矩阵,这样就可以去除那些稀疏特征,起到一个特征选择的作用。
当l1正则化的正则化系数较小时,也可以起到防止模型过拟合的作用。
L2:作用
l2可以有效防止模型过拟合,提高模型的兼容性和鲁棒性。
那么l1,l2如何使用在公式之中,详细的使用过程见:
以下链接,讲得特别好,收藏一下。
https://blog.csdn.net/jinping_shi/article/details/52433975
说一句,想这样的题目,面试的时候面试官是会问你的,如果从事机器学习,数据挖掘这方面的同学,一定需要掌握的。