机器学习算法/模型——阶段性总结（4）更高层次

最新推荐文章于 2021-12-11 16:48:33 发布

Robin_Pi

最新推荐文章于 2021-12-11 16:48:33 发布

阅读量267

点赞数

分类专栏：机器学习（ML）

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Robin_Pi/article/details/104523885

版权

机器学习（ML）专栏收录该内容

49 篇文章 14 订阅

订阅专栏

关于数据

特征空间

原来图像特征的表示也可以理解为 BOW（bag of words）

博文：机器学习中的特征空间
原 PPT 资源：点击

在这里插入图片描述

在这里插入图片描述

关于算法模型

为什么需要假设？因为实际不存在完美的预测模型。

最小二乘法是线性模型的通用优化方法，
梯度下降只不过是其中一种，为了解决求解不了方程的时候（高维的线性模型甚至非线性模型，目标函数往往并不是全局凸函数，因此不能继续使用导数为零的方式进行最优解求解）

过拟合的问题本质上是方程组的解有无穷多个，而算法模型选择了其中较为复杂的一种。

根据奥卡姆剃刀原理，越简单的模型在未知的样本上的泛化能力越好。

SVM解决了线性模型解决不了的，当m<n时候的情况，

当随机噪声服从正态分布时，最小二乘与最大似然等价。

损失函数（与距离度量）

为了解决基于原始输入样本数据构成的线性方程组无解的问题，我们引入了损失函数，之后问题转换为了求解损失函数的参数解。

最常用的5个回归损失函数

优化算法

模型评估

模型评估指标

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
机器学习算法/模型——阶段性总结（4）更高层次

关于模型套路损失函数的本质是物理世界和数学公式之间的桥梁，选择何种损失函数取决于我们如何看待我们的问题场景，以及我们希望得到什么样的解释。偶然性-波动-偏置我们最终需要的模型要用来表征实际的情况。但模型不可能百分百正确地反映真实情况，总有误差，因此我们可以给这个模型加上个误差项 ϵ\epsilonϵ（或者说噪音）。例如，重新写成：注意：偏置不是正则项！关于模型函数为什么需要假设？因...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。