一起对话式学习-机器学习02——机器学习方法三要素

最新推荐文章于 2024-10-15 10:20:47 发布

Victory_orsh

最新推荐文章于 2024-10-15 10:20:47 发布

阅读量1.2k

点赞数 13

分类专栏：对话式学习-机器学习通俗易懂文章标签：学习机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_73074505/article/details/142303118

版权

通俗易懂同时被 2 个专栏收录

17 篇文章 0 订阅

订阅专栏

对话式学习-机器学习

3 篇文章 0 订阅

订阅专栏

【一】核方法

首先补充一下核方法，这应是机器学习分类中的内容。

什么是核方法呢？听起来很高级，但理解很简单：

官方定义：核方法是使用核函数表示和学习非线性模型的一种机器学习方法，可以用于监督学习和非监督学习。

理解：在分类问题中很多情况下并不能用线性（二维中是一条线，三维则是一个平面，当然还有更高维）去划分，而是非线性的。核方法则可以利用核函数将输入映射到一个特征空间中，使其映射后的样本点变得可分。

如我们常见的几种模型：核函数支持向量机、核PCA、核K-means等。

【二】机器学习方法三要素

机器学习方法=模型+策略+算法

可以理解为：机器学习模型在一定优化策略下使用相应求解算法来达到最优化目标。

1.模型

这里只介绍监督学习的两种：决策函数与条件概率分布，即非概率模型与概率模型。

给出二者形式就明了了：

$Y=f(X)$

这是一个决策函数，就是我们平时的一个x关于y的函数，给定x，如果已知全部参数，则模型确定输出y。当然，在模型中，这样的函数很可能不止一个，而是一个集合，自变量x可能也有很多，关系可能错综复杂。

$P=P(Y|X)$

这是一个条件概率分布，就是我们平时的概率密度函数，在已知X的情况下，确定Y的相应概率分布，只不过要注意，这个分布通常由参数 $\theta$ 决定，具体可以参照01贝叶斯学习。同样，在模型中，这样的函数很可能不止一个，而是一个集合。

2.策略

所谓策略就是以什么准则进行学习以及选取最优模型。

我们给出损失函数与风险函数：

有以下几种损失函数：

（图片来自此，侵删）

就是在训练完后进行测试时，用来度量预测结果和真实值之间的差异。还有其他更复杂的损失函数，具体模型最优选取不同。

接下是风险函数，很简单，就是损失函数的期望，模型平均意义下的损失。

$R=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i}) )$

其中，模型关于训练集的平均损失称为经验风险或经验损失。根据大数定律，当数据集样本数量N趋于无穷，经验风险就是期望风险，所以我们可以用训练集下的经验风险来代替所有数据下的期望风险。

为什么不能直接计算期望风险呢？因为你不可能知道每次实例X下的输出Y，不然什么都知道还预测什么？

但是我们知道，用样本代替总体（大数定律）的思想很好，但总归是有误差，所以仅仅依靠经验风险来评估是不科学的，为此，我们提出结构风险：

$R=\frac{1}{N}\sum_{i=1}^{N}L(y_{i},f(x_{i}) )+\lambda J(f))$

可以看到，其实就是将经验期望后加了一项，这项称之为正则化项或惩罚项，为的就是防止过拟合（由于模型捕捉了训练集上的过多细节导致的模型过于复杂化）。其中 $\lambda$ 系数决定了惩罚力度。

所以，我们最终要做的就是将经验风险最小化与结构风险最小化。

3.算法

经过模型和策略的选定，实际上机器学习问题到这里就变成了最优化问题——求解经验风险最小化与结构风险最小化。

这部分可以阅读最优化问题的相关书籍或观看视频深入了解。

Over！！！

关注

13
点赞
踩
22

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

Victory_orsh CSDN认证博客专家 CSDN认证企业博客

码龄2年

49: 原创

3万+: 周排名

3万+: 总排名

3万+: 访问

: 等级

1019: 积分

364: 粉丝

518: 获赞

7: 评论

495: 收藏

私信

关注

热门文章

分类专栏

最新评论

前端三件套（HTML，CSS，JS）查漏补缺
2301_77527844: http驾使员httpC语言是一门综合的语言艺术https://www.r.HTML.r
为什么要有mybatis？——mybatis
征途黯然.: I'm impressed by this article about 为什么要有mybatismybatis. The expertise is impressive.
算法模板——数据结构篇
普通网友: 干货满满，细节很到位！【我也写了一些相关领域的文章，希望能够得到博主的指导，共同进步！】
C. Vlad and a Sum of Sum of Digits (CF Div. 4)
CSDN-Ada助手: 恭喜你写了第16篇博客！看到你对C. Vlad and a Sum of Sum of Digits (CF Div. 4)的讨论，我感到非常欣慰。你的分析和解决问题的能力让我十分钦佩。希望你能继续保持创作的热情，并且不断提升自己的写作技巧，可以尝试挑战一些更深入的话题，或者尝试与其他领域结合，让你的博客内容更加丰富。期待你的下一篇作品！
算法竞赛实用板子
CSDN-Ada助手: 恭喜你写了第17篇博客！看到你分享关于“算法竞赛实用板子”的内容，我觉得非常受益。希望你能继续坚持创作，分享更多有价值的内容给大家。下一步，或许可以考虑加入一些个人的实战经验分享，或者深入探讨一些具体的算法技巧，让读者能够更加深入地理解和应用。期待你的下一篇作品！

最新文章

2024

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。