【统计学习方法】第一章概论

最新推荐文章于 2024-09-19 16:58:29 发布

aaon22357

最新推荐文章于 2024-09-19 16:58:29 发布

阅读量148

点赞数

分类专栏：机器学习文章标签：机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/aaon22357/article/details/90208957

版权

机器学习专栏收录该内容

9 篇文章 0 订阅

订阅专栏

文章目录

基础概念
- 期望风险、经验风险、结构风险
第一章统计学习方法概论

基础概念

期望风险、经验风险、结构风险

经验风险：就是训练误差
结构风险：训练误差 + 表示模型复杂度的正则项（结构风险就是训练误差和模型复杂度之和)

经验风险是局部概念，针对训练样本的损失函数，可以求得。
期望风险是全局概念，针对未知测试样本的损失函数，求不得。
结构风险是两者的折中处理，是经验风险和正则化的加和。

第一章统计学习方法概论

模型选择的典型方法：正则化和交叉验证。

1.正则化

就是在经验风险的基础上，再加一个正则化项，正则化项一般是模型参数向量的范数。模型越复杂，正则化值越大，也就是说在满足条件的情况下，应该选择尽量简单的模型。

2.交叉验证

数据集常被分为三部分，训练集、验证集和测试集，最终==选择对验证集有最小预测误差的模型==。

交叉验证就是重复使用数据，具体分为：

简单交叉验证

训练数据只分一次组，用来测试的（验证集）是固定且唯一的，选择使得验证集上误差最小的模型。
S折交叉验证

训练数据随机分成S个不相交的子集，S-1份用于训练，1份用于验证，最后选出S次评测中平均验证误差最小的模型。

3.泛化能力

泛化能力，就是模型对未知数据的预测能力。训练误差越小，泛化误差也越小。

4.生成模型与判别模型

简单学习的目的就是学习一个模型，这个模型的一般形式为决策函数： $Y = f (X)$ 或者条件概率分布： $Y = f (Y ∣ X)$
监督学习方法又可以分为生成方法和判别方法，所学到的模型分别称为生成模型和判别模型。

生成方法

学习联合概率分布 $P (X, Y)$ ，然后求出条件概率分布 $P (Y ∣ X)$ 作为预测的模型，即生成模型：
$P(Y|X)=\frac{P(X,Y)}{P(X)}$
典型的生成模型有：朴素贝叶斯法，隐马尔可夫模型
特点：学习收敛速度快

判别方法

直接学习决策函数 $f (X)$ 或条件概率分布 $P (Y ∣ X)$ ，通过该方法学到的模型称为判别模型。
典型的判别模型有：k近邻法，感知机，决策树，逻辑回归，最大熵模型，支持向量机，提升方法，条件随机场等。
特点：准确率更高。

5.分类问题

分类问题：就是当输出变量Y取有限个离散值的时候，这个问题就是分类问题。
在这里插入图片描述 准确率就是：预测的所有正类中，预测对了的正类所占比例。

召回率是：真实的所有正类中，预测对了的正类所占比例。

两者的分子部分是一样的，都是预测对了的正类，分母不一样。

6.回归问题

回归学习最常用的损失函数是平方损失函数，在此情况下，回归问题可以用最小二乘法求解。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

aaon22357 CSDN认证博客专家 CSDN认证企业博客

码龄7年

173: 原创

3万+: 周排名

15万+: 总排名

63万+: 访问

: 等级

6000: 积分

111: 粉丝

296: 获赞

170: 评论

1143: 收藏

私信

关注

热门文章

分类专栏

最新评论

ubuntu配置nvidia显卡性能
weixin_46489615: 请问您解决了吗，我也是同样的问题
linux手动安装 vscode-server
CSDN-Ada助手: CS入门技能树或许可以帮到你：https://edu.csdn.net/skill/gml?utm_source=AI_act_gml
ubuntu配置nvidia显卡性能
不加盐: 请问RTX 4090还支持这样操作吗？我试了没有这么多选项，只有Thermal Settings和Application Profiles这两个选项，怎么能调到P0呢？或者说让它固定在P0状态呢？
解决vs资源管理器不显示头文件源文件
BABY APRIL: 我折腾了两天。。。
Windows Powershell配置及美化教程
CSDN-Ada助手: 非常感谢CSDN博主的分享，这篇博客真的很实用！我觉得下一篇博客可以写一下关于Windows系统上一些实用的命令行工具的使用技巧，比如说ping、tracert、netstat等等，这样的技术文章对其他用户肯定也会非常有帮助。相信CSDN博主一定有更多的技术经验和心得体会，期待更多的精彩文章！为了方便博主创作，提高生产力，CSDN上线了AI写作助手功能，就在创作编辑器右侧哦～（https://mp.csdn.net/edit?utm_source=blog_comment_recall ）诚邀您来加入测评，到此（https://activity.csdn.net/creatActivity?id=10450&utm_source=blog_comment_recall）发布测评文章即可获得「话题勋章」，同时还有机会拿定制奖牌。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。