[机器学习]Lecture 2(Basic theory)：浅谈机器学习原理

最新推荐文章于 2024-08-23 17:48:13 发布

zzz_qing

最新推荐文章于 2024-08-23 17:48:13 发布

阅读量363

点赞数

文章标签：机器学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zzz_qing/article/details/130010162

版权

文章探讨了机器学习的基础思想，强调了模型复杂度（|H|）与过拟合的关系，以及损失函数在优化过程中的作用。讨论了选取坏的训练数据集（Dtrain）的概率，并指出增加样本数量或调整模型复杂度可以改善这一情况。深度学习作为解决模型复杂度与性能之间平衡的一种方法也被提及。

摘要由CSDN通过智能技术生成

目录

Review: Basic Idea of ML

Step 1: Function with Unknown Parameters

Step 2: Loss of a function

Step 3: Optimization

关于sample训练资料的讨论

浅谈机器学习原理

——再探宝可梦、数码宝贝分类器

Review: Basic Idea of ML

More parameters, easier to overfit.

Step 1: Function with Unknown Parameters

H表示未知参数h所有可能取值的集合

|H|表示在H里面有多少可能的选择，这个可能选择的数目叫做模型的复杂程度

Step 2: Loss of a function

Step 3: Optimization

Training Examples

What do we want? We want to sample good Dtrain.

关于sample训练资料的讨论

下面讨论sample到一组坏的训练资料的几率有多大，这个讨论具有普适性，与model、loss function这些都没有关系。首先定义什么叫做不好的Dtrain，如下图：

如下图，选取到不好的Dtrain的概率会小于图中红框部分的概率（红框中的概率是Dtrain is bad的概率的上界，但是在实际中，红框部分概率很容易出现大于1的情况，这时候这个上界的值是没有作用的）。降低这个上界的办法是使用更大的N（sample更多的训练资料）或降低|H|的值（|H|在上面有解释）

通常来说，训练资料的数量在实际应用中不是由我们自己决定的，而改变|H|的大小，如下图，large |H|会使得理想与现实相差很大，而small |H|会使得理想变得很差，要想鱼与熊掌兼得——Deep learning。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
[机器学习]Lecture 2(Basic theory)：浅谈机器学习原理

浅谈机器学习原理——再探宝可梦、数码宝贝分类器。
复制链接

扫一扫

zzz_qing CSDN认证博客专家 CSDN认证企业博客

码龄5年

44: 原创

119万+: 周排名

95万+: 总排名

1万+: 访问

: 等级

448: 积分

9: 粉丝

2: 获赞

7: 评论

12: 收藏

私信

关注

热门文章

分类专栏

论文精读 2篇

最新评论

Overcoming catastrophic forgetting in neural networks
xuebing55555: 请问有完整实现代码吗？
Lecture 15：元学习Meta Learning2
CSDN-Ada助手: 非常棒的博客！学习元学习是非常有趣和有用的！我们希望看到更多关于此主题的内容。我们建议您写一篇有关如何使用元学习来优化深度学习模型的博客。谢谢你的分享！ 2023年博客之星「城市赛道」年中评选已开启（https://activity.csdn.net/creatActivity?id=10470&utm_source=blog_comment_city ），博主的原力值在所在城市已经名列前茅，持续创作就有机会成为所在城市的 TOP1 博主（https://bbs.csdn.net/forums/blogstar2023?typeId=3152981&utm_source=blog_comment_city），更有丰厚奖品等你来拿~。
Lecture 15：元学习Meta Learning2
CSDN-Ada助手: 恭喜你，获得了 2023 博客之星评选的入围资格，请看这个帖子（https://bbs.csdn.net/topics/615663682?utm_source=blogger_star_comment）。请在这里提供反馈： https://blogdev.blog.csdn.net/article/details/129986459?utm_source=blogger_star_comment。
The first GAN——Generative Adversarial Nets
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/614789723。
[机器学习]Lecture 1：Regression，Pokemon classification，Logistic Regression
CSDN-Ada助手: 非常感谢您分享这篇博客。恭喜您能够坚持创作，继续保持哦！同时，我希望您能够在未来的博客中，更深入地探讨机器学习的其他方面，例如深度学习和神经网络等等。期待您的下一篇作品，谢谢！ CSDN 正在通过评论红包奖励优秀博客，请看红包流：https://bbs.csdn.net/?type=4&header=0&utm_source=ada，我们会奖励持续创作和学习的博主，请看：https://bbs.csdn.net/forums/csdnnews?typeId=116148

大家在看

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。