西瓜书Task1

arbreor

于 2024-05-15 20:56:02 发布

阅读量341

点赞数 3

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/arbreor/article/details/138909466

版权

第一章相关数学符号

1、模型

介绍了机器学习流程：收集若干样本——训练样本（80 个）和测试样本（20个）——选用机器学习算法——在训练集上进行训练——产出得到模型——用测试集来测试模型的效果

2、泛化

＃数据：数据量——经验，特征工程——区分人种
＃算法：数据→模型
＃分布：样本推总体

3、分布

假设样本空间服从一个未知“分布”D，收集到的样本都是独立地从该分布中采样得到，即“独立同分布”。通常收集到的样本越多，越能从样本中反推出D的信息

4、假设空间

假设xy关系（一次or二次）→算法→模型

5、归纳偏好

不同机器学习算法偏好不同（一元线性回归算法or多项式回归算法）→看测试集表现

第二章模型评估与选择

1、经验误差与过拟合

#错误率：E= a m

#精度：精度=1-错误率

#误差：学习器的实际预测输出与样本的真实输出之间的差异。

#经验误差/训练误差：学习器在训练集上的误差，平均值

#泛化误差：学习器在新样本上的误差，平均值

#过拟合：模型的学习能力相对于数据来说过于强大

2、评估方法

#3折交叉验证

两套参数配置方案——通过分层采样将数据集D划分为3个大小相似的互斥子集——将3次测试结果求平均——Scorea、Scoreb——比较Scorea 和 Scoreb 优劣——确定算法在数据集D上效果最好的参数配置方案

#验证集

划分出训练集和测试集——对训练集采用留出法划分出训练集和新的测试集（验证集）——基于验证集的测试结果——调参选出最优参数配置方案——将验证集合并进训练集——合并后的训练集上重新训练——再用测试集来评估训练得到的模型的性能

关注

3
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
西瓜书Task1

介绍了机器学习流程：收集若干样本——训练样本（80 个）和测试样本（20个）——选用机器学习算法——在训练集上进行训练——产出得到模型——用测试集来测试模型的效果。
复制链接

扫一扫

arbreor CSDN认证博客专家 CSDN认证企业博客

码龄3年

8: 原创

147万+: 周排名

12万+: 总排名

3052: 访问

: 等级

138: 积分

41: 粉丝

58: 获赞

2: 评论

61: 收藏

私信

关注

热门文章

最新评论

西瓜书 Task4 决策树
CSDN-Ada助手: 恭喜你写完了第四篇博客“西瓜书 Task4”！非常感谢你的坚持和努力，继续创作下去吧！下一步建议可以尝试探讨更深入的主题，或者结合实际案例进行分析，让读者更加深入理解。希望你继续保持创作的热情和耐心，期待你更多精彩的作品！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5
西瓜书Task1
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python

大家在看

计算文件md5值工具分析(自己写的）

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。