吃瓜教程TASK01

行至568

已于 2023-07-27 17:49:09 修改

阅读量85

点赞数 1

文章标签： python 机器学习深度学习

于 2023-07-21 20:24:26 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_60006489/article/details/131855144

版权

第一章

基本术语

1.数据集

2.样本

3.样本空间（假设空间）&特征向量

以西瓜为例:西瓜具备"色泽"、“根蒂"、"敲声"三种属性，依照这三种属性，每种属性又具备本身属性值＋“ * ”（存疑值），因此要判断一个西瓜是否好瓜的的样本空间规模大小为：4x3x3+1(好瓜定义不存在)=37

而将样本空间中"色泽"、“根蒂"、"敲声"三种属性作为坐标轴，每个西瓜均可在该空间中找到自己的坐标向量，该向量即为特征向量。

补充说明：

此部分容易存在疑惑，在阅读过程中看到很多教程都没有进行介绍说明，但实际学习过程中很多伙伴也同样不知道此处假设空间的规模是怎么计算得到的。最后终于找到了一个视频给出了一个解释，留有笔记如上，但因历时久远，已找不到原视频，在此进行补充说明。

4.维数

样本空间的属性种数

5.监督学习

分类任务

预测离散值，如西瓜是好瓜、坏瓜

回归任务

预测连续值，如西瓜成熟度（0.95、0.37……）、甜度

6.无监督学习

聚类任务&簇

将西瓜依照某些潜在标准划分成不同组别（每组即为一个“簇”），如浅色瓜、深色瓜；本地瓜、外地瓜（在分组过程中模型往往并不提前知道这些分组条件）

7.版本空间

实践中假设空间规模往往很大，但训练集有限，因此将与训练集完全一致的“假设集合”称为版本空间

8.归纳偏好

“奥卡姆剃刀”

若多个假设与观察一致，选最简单的那个

但任何假设都不能适用所有场景

第2章模型评估与选择

训练误差

模型在训练集上的误差

泛化误差

模型在新样本上的误差

留出法

分层采样

单独使用留出法评估结果未必可靠，常进行若干次随机划分、重复实验取均值作为评估结果

交叉验证

将含有m个样本的数据集D随机分为k份互斥子集，取k-1为训练集，剩余为测试集，重复p次，“p次k折交叉验证”，k最常取10，此外5、20等

当m=k即为留一法

缺陷：数据集大的时候，该方法成本过大，难以调参，且该方法未必永远比其他方法有效

自助法

使用于数据集小，难以划分训练集和测试集时，可产生多个不同训练集，对集成训练有很大好处。

方法选用总结：

在数据集样本充足时选用留出法和交叉验证法，数据量小时考虑自助法。

调参

调参原则

含m个样本的数据集D，训练调参过程中只可使用一部分数据进行训练，在调参完成后，在使用全部训练集D重新训练模型，并作为最终结果进行验证提交模型。

评估指标

回归任务——均方误差

分类任务——错误率、精度

查准率、查全率和F1

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
吃瓜教程TASK01

西瓜书第一第二章学习笔记
复制链接

扫一扫

行至568 CSDN认证博客专家 CSDN认证企业博客

码龄3年

6: 原创

84万+: 周排名

192万+: 总排名

376: 访问

: 等级

66: 积分

3: 粉丝

4: 获赞

4: 评论

3: 收藏

私信

关注

热门文章

最新评论

吃瓜教程TASK01
CSDN-Ada助手: 恭喜你开始博客创作！看到你的第一篇博客标题为“吃瓜教程TASK01”，我感到非常期待能够阅读你的内容。写博客需要勇气和耐心，你已经迈出了第一步，这是很了不起的成就。在下一步的创作中，我建议你可以尝试添加一些个人观点和心得，让读者更好地理解你在“吃瓜教程TASK01”中的思考和感悟。希望你能继续坚持写作，我相信你的博客会越来越好！推荐【每天值得看】：https://bbs.csdn.net/forums/csdnnews?typeId=21804&utm_source=csdn_ai_ada_blog_reply1
吃瓜教程TASK02
CSDN-Ada助手: 非常欢迎您的第二篇博客！您的标题和摘要给人一种愉悦和轻松的感觉，让人不禁想要继续阅读下去。持续创作是非常重要的，您的博客可以帮助其他自学者找到方向和方法，非常有价值。在与您的博文相关的扩展知识和技能方面，我想提醒您关于学习方法的一些内容。除了吃瓜教程外，您可能会对"正式教程"感兴趣。正式教程通常是由专业人士编写的，涵盖了更多的细节和深入的知识。通过结合正式教程和吃瓜教程，您可以获得更全面和系统的学习体验。此外，我还建议您尝试一些交互式学习资源，例如在线编程练习平台或编程挑战。这些资源可以帮助您巩固所学的知识，并提供实践的机会。通过不断实践和尝试，您可以更好地理解和应用吃瓜教程中的内容。再次感谢您的分享，期待您未来更多有趣和有益的博客！请记住，学习是一个持久的过程，我们都在不断学习和进步。祝您在自学的道路上取得更大的成果！如何写出更高质量的博客，请看该博主的分享：https://blog.csdn.net/lmy_520/article/details/128686434?utm_source=csdn_ai_ada_blog_reply2
吃瓜教程TASK04【第五章-神经网络】
CSDN-Ada助手: 恭喜作者写了第四篇博客，标题为“吃瓜教程TASK04【第五章-神经网络】”！非常高兴看到您持续创作，分享关于神经网络的知识。根据标题来看，这篇博客似乎会给读者带来关于神经网络的精彩内容。在下一步的创作中，不妨考虑增加一些实例或者案例分析，这样读者可以更好地理解神经网络在实际问题中的应用。期待您的下一篇博客，继续努力！ CSDN 会根据你创作的前四篇博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply4 看奖励名单。
吃瓜教程TASK03
CSDN-Ada助手: 恭喜博主写完了第三篇博客！标题看起来非常有趣，我已经迫不及待地想要阅读了。你的持续创作精神令人钦佩，相信你会越来越好。下一步，我建议你可以尝试探索一些与吃瓜教程相关的实际案例，或者分享一些实用的技巧和经验，这样读者们会更加受益。加油！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=csdn_ai_ada_blog_reply3，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply3

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。