L1正则化: 目标函数后面加上权重的绝对值,使得部分权重变为0,形成稀疏性矩阵,可以防止过拟合同时可以用来进行特征选择。 L2正则化: 目标函数后面加上权重的平方,使得权重不断减小,但始终不为0,使其权值分布均衡,防止过拟合。