l0:非0的个数
l1: 所有数的绝对值相加
为了避免过拟合,所以我们采用l1范数的正则项正则化,
损失函数加上正则化避免过拟合,正则化越小,矩阵越稀疏,我们求解的时候回得到很多满足条件的解,所以选择一个比较稀疏的矩阵防止过拟合,留下的都是有用的
这就是解与正则相互作用
l0:非0的个数
l1: 所有数的绝对值相加
为了避免过拟合,所以我们采用l1范数的正则项正则化,
损失函数加上正则化避免过拟合,正则化越小,矩阵越稀疏,我们求解的时候回得到很多满足条件的解,所以选择一个比较稀疏的矩阵防止过拟合,留下的都是有用的
这就是解与正则相互作用