python机器学习笔记（一）：理论

最新推荐文章于 2024-09-07 16:10:07 发布

qq_35658177

最新推荐文章于 2024-09-07 16:10:07 发布

阅读量122

点赞数

分类专栏：机器学习文章标签：机器学习 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_35658177/article/details/102723698

版权

机器学习专栏收录该内容

5 篇文章 0 订阅

订阅专栏

三种不同方法

监督学习supervised learning
无监督学习unspervised learning
强化学习reinforcement learning

通过监督学习对未来事件进行预测

监督是指训练数据集中的每个样本均有一个已知的输出项（类标（label））

分类
回归（预测）

通过强化学习解决交互式问题

强化学习的目标是构建一个系统(Agent)，在与环境(environment)交互的过程中提高系统的性能。
环境的当前状态信息中通常包含一个反馈(reward)信号,在强化学习过程中，这个反馈值不是一个确定的类标或者连续类型的值，而是一个通过反馈函数产生的对当前系统行为的评价。通过与环境的交互，Agent可以通过强化学习来得到一系列行为，通过探索性的试错或借助精心设计的激励系统得到正向反馈最大化。

象棋对弈

通过无监督学习发现数据本身潜在的结构

聚类
数据降维
无监督降维是数据特征预处理时常用的技术，用于清除数据中的噪声，能够在最大程度保留相关信息的情况下将数据压缩到一个维度较小的子空间，但同时也可能降低某些算法在准确性方面的性能。

机器学习步骤

数据预处理
选择预测模型类型并进行训练
模型验证与使用未知数据进行预测

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
python机器学习笔记（一）：理论

三种不同方法监督学习supervised learning无监督学习unspervised learning强化学习reinforcement learning通过监督学习对未来事件进行预测监督是指训练数据集中的每个样本均有一个已知的输出项（类标（label））分类回归（预测）通过强化学习解决交互式问题强化学习的目标是构建一个系统(Agent)，在与环境(environm...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。