2021-01-14

最新推荐文章于 2024-07-20 10:44:05 发布

Puppyxuan

最新推荐文章于 2024-07-20 10:44:05 发布

阅读量378

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/Puppyxuan/article/details/112604414

版权

方法论

1.任何函数都可以用多项式的方式去趋近
2.最小化目标函数，即最小化误差
3.最小化误差是为了让我们的模型拟合我们的训练数据，而规则化参数是防止我们的模型过分拟合我们的训练数据。因为参数太多，会导致我们的模型复杂度上升，容易过拟合，也就是我们的训练误差会很小。但训练误差小并不是我们的最终目标，我们的目标是希望模型的测试误差小，也就是能准确的预测新的样本。所以，我们需要保证模型“简单”的基础上最小化训练误差，这样得到的参数才具有好的泛化性能（也就是测试误差也小），而模型“简单”就是通过规则函数来实现的。另外，规则项的使用还可以约束我们的模型的特性。这样就可以将人对这个模型的先验知识融入到模型的学习当中，强行地让学习到的模型具有人想要的特性，例如稀疏、低秩、平滑等等
4.机器学习的大部分带参模型都和这个不但形似，而且神似。是的，其实大部分无非就是变换这两项而已。对于第一项Loss函数，如果是Square loss，那就是最小二乘了；如果是Hinge Loss，那就是著名的SVM了；如果是exp-Loss，那就是牛逼的 Boosting了；如果是log-Loss，那就是Logistic Regression了；还有等等。不同的loss函数，具有不同的拟合特性，这个也得就具体问题具体分析的。但这里，我们先不究loss函数的问题，我们把目光转向“规则项Ω(w)”。
5.L1范数和L0范数可以实现稀疏，L1因具有比L0更好的优化求解特性而被广泛应用。
稀疏化：机器学习中的特征有很大一部分是和最终的输出是没有关系的，在最小化的时候考虑这些特征虽然可以最小化误差，但是在预测的时候会造成错误。稀疏规则化算子的引入就是为了完成特征自动选择的光荣使命，它会学习地去掉这些没有信息的特征，也就是把这些特征对应的权重置为0

Puppyxuan

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2021-01-14

方法论1.任何函数都可以用多项式的方式去趋近2.最小化目标函数，即最小化误差3.最小化误差是为了让我们的模型拟合我们的训练数据，而规则化参数是防止我们的模型过分拟合我们的训练数据。因为参数太多，会导致我们的模型复杂度上升，容易过拟合，也就是我们的训练误差会很小。但训练误差小并不是我们的最终目标，我们的目标是希望模型的测试误差小，也就是能准确的预测新的样本。所以，我们需要保证模型“简单”的基础上最小化训练误差，这样得到的参数才具有好的泛化性能（也就是测试误差也小），而模型“简单”就是通过规则函数来实现的
复制链接

扫一扫