深度学习之强化学习

最新推荐文章于 2024-10-05 19:19:55 发布

uu1224

最新推荐文章于 2024-10-05 19:19:55 发布

阅读量303

点赞数 5

文章标签：深度学习人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_77681528/article/details/136438022

版权

本文探讨了监督学习与非监督学习的区别，包括监督学习依赖于带标签数据进行模型训练，非监督学习则通过聚类找出数据内在结构。此外，文章提到了生成对抗性网络在合成数据生成中的应用，并指出传统的离线学习虽然便于模式识别，但在智能代理与环境互动方面存在局限。

摘要由CSDN通过智能技术生成

监督学习与非监督学习

监督学习

监督学习是通过带有标签或对应结果的样本训练得到一个最优模型，再利用这个模型将所有输入映射为相应输出，以实现分类

非监督学习

非监督学习是在样本的标签未知的情况下，根据样本之间的相似性对样本集进行聚类，使类内差距最小化，学习出分类器

监督学习

例子：假设我们需要预测患者的心脏病是否会发作，那么观察结果“心脏病发作”或“心脏病没有发作”将是样本的标签。输入特征可能是生命体征，如心率、舒张压和收缩压等。

监督学习之所以能发挥作用，是因为在训练参数时，我们为模型提供了一个数据集，其中每个样本都有真实的标签。

即使使用简单的描述给定输入特征的预测标签，监督学习也可以采取多种形式的模型，并且需要大量不同的建模决策，这取决于输入和输出的类型、大小和数量。例如，我们使用不同的模型来处理“任意长度的序列”或“固定长度的序列”。

无监督学习

生成对抗性网络（generative adversarial networks）：为我们提供一种合成数据的方法，甚至像图像和音频这样复杂的非结构化数据。潜在的统计机制是检查真实和虚假数据是否相同的测试。它是无监督学习的另一个重要而令人兴奋的领域。

机器学习的输入（数据）来自哪里？机器学习的输出又将去往何方？

到目前为止，不管是监督学习还是无监督学习，我们都会预先获取大量数据，然后启动模型，不再与环境交互。 这里所有学习都是在算法与环境断开后进行的，被称为离线学习（offline learning）。

离线学习有它的魅力：

好的一面是，我们可以孤立地进行模式识别，而不必分心于其他问题。

但缺点是，解决的问题相当有限。这时我们可能会期望人工智能不仅能够做出预测，而且能够与真实环境互动。 与预测不同，“与真实环境互动”实际上会影响环境。

这里的人工智能是“智能代理”，而不仅是“预测模型”。

因此，我们必须考虑到它的行为可能会影响未来的观察结果。

对于监督学习，从环境中收集数据的过程类似于：

关注

5
点赞
踩
6

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

uu1224 CSDN认证博客专家 CSDN认证企业博客

码龄1年

23: 原创

122万+: 周排名

7万+: 总排名

1万+: 访问

: 等级

510: 积分

252: 粉丝

275: 获赞

14: 评论

283: 收藏

私信

关注

热门文章

最新评论

idea
CSDN-Ada助手: 不知道 Java 技能树是否可以帮到你：https://edu.csdn.net/skill/java?utm_source=AI_act_java
PyTorch深度学习基础之Reducation操作和PyTorch自动微分
CSDN-Ada助手: 恭喜作者发布了第18篇博客，涉及PyTorch深度学习基础中的Reducation操作和PyTorch自动微分，内容十分丰富深入。希望作者能够继续坚持创作，分享更多有关PyTorch深度学习的知识和经验。建议下一步可以探讨PyTorch在图像处理或自然语言处理领域的应用，相信会为读者带来更多启发和帮助。期待作者的下一篇作品！
Logistic回归
CSDN-Ada助手: 恭喜您发布了关于Logistic回归的第19篇博客！持续创作是非常不容易的，您的努力和热情让读者受益匪浅。希望您可以继续保持写作的热情，探索更多关于机器学习的内容，也可以考虑分享一些实践经验或者案例分析，这样可以更好地帮助读者理解和运用相关知识。期待您的下一篇作品！祝您写作顺利！
Logistic回归
CSDN-Ada助手: 恭喜作者在博客领域迈出了第20步，标题为“Logistic回归”的文章内容也相当精彩。希望作者能够继续保持创作的热情和耐心，不断挖掘更多领域的知识，为读者带来更多有价值的内容。建议下一篇博客可以围绕“神经网络”的主题展开，相信作者一定能够有更深入的见解和独特的观点。期待您的下一篇作品！
Caffe、TensorFlow、PyTorch三者比较
ha_lydms: 作者的文字总是能够打动我的心灵，让我感到内心温暖和安慰。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。