统计学习方法学习笔记第一章（二）

最新推荐文章于 2023-03-09 22:01:42 发布

HaZyiCe

最新推荐文章于 2023-03-09 22:01:42 发布

阅读量124

点赞数

分类专栏：统计学习方法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44939026/article/details/106035917

版权

统计学习方法专栏收录该内容

6 篇文章 0 订阅

订阅专栏

1.4 模型评估与模型选择

1.4.1 训练误差与测试误差

训练误差

第一步得到的训练模型为，训练误差是模型关于训练数据集的平均损失：

其中N是训练样本容量

测试误差

测试误差是训练模型关于测试数据集的平均损失：

其中，N' 是测试样本容量

测试误差更加重要，训练误差不是很重要，因为测试误差反映的是对未知数据的预测能力。对未来数据的预测能力叫做泛化能力。

当损失函数是0-1损失时，测试误差就变成了误差率（error rate）

这里I为指示函数（Indicator function），即yi≠f(xi) 时为1，否则为0.

相应的，测试数据集上的准确率（accuracy）为

显然，rtest+etest=1

1.4.2 过拟合与模型选择

当模型复杂度增大时，训练误差会逐渐减小为0，而测试误差会先减小，随后增大。当选择的模型复杂度过大时，过拟合就会发生。所以，在学习时就要防止过拟合，进行最优的模型选择，即选择复杂度适当的模型，以达到使测试误差最小的学习目的。

1.5 正则化与交叉验证

为了防止过拟合，就要选择复杂度适当的模型，模型选择的方法主要有正则化和交叉验证。

1.5.1 正则化

正则化就是在特征数量不变的情况下，减少某些θ参数的值，使其对预测结果（y）的贡献较小！

1.5.2 交叉验证

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法学习笔记第一章（二）

1.4 模型评估与模型选择1.4.1 训练误差与测试误差训练误差第一步得到的训练模型为，训练误差是模型关于训练数据集的平均损失：其中N是训练样本容量测试误差测试误差是训练模型关于测试数据集的平均损失：其中，N'是测试样本容量测试误差更加重要，训练误差不是很重要，因为测试误差反映的是对未知数据的预测能力。对未来数据的预测能力叫做泛化能力。当损失函数是0-1损失时，测试误差就变成了误差率（error rate）这里I为指示函数（Indica...
复制链接

扫一扫

专栏目录

HaZyiCe CSDN认证博客专家 CSDN认证企业博客

码龄5年

10: 原创

75万+: 周排名

183万+: 总排名

2万+: 访问

: 等级

320: 积分

15: 粉丝

21: 获赞

6: 评论

99: 收藏

私信

关注

热门文章

分类专栏

EEG处理学习 4篇
统计学习方法 6篇

最新评论

对Deap数据进行截取
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)使用标准目录；(2)使用更多的站内链接；(3)文章不宜太短。
DEAP:使用生理信号进行情绪分析的数据库IEEE
脑电情绪识别: 我申请DEAP数据成功了，需要DEAP数据的可以加我QQ3196288251
统计学习方法学习笔记第二章感知机
ctotalk: 加油
DEAP:使用生理信号进行情绪分析的数据库IEEE
qq_38489415: 大佬，你好。请问有DEAP数据集吗？我申请了，但是一直没回复。您能分享一下吗？我的邮箱是1275575706@qq.com。谢谢
DEAP:使用生理信号进行情绪分析的数据库IEEE
牛杂师傅: 博主自己评论的吗

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。