【1】机器学习--概念篇

最新推荐文章于 2024-08-07 21:18:06 发布

gaofeng2001_ren

最新推荐文章于 2024-08-07 21:18:06 发布

阅读量291

点赞数

分类专栏：技术之路文章标签：机器学习

技术之路专栏收录该内容

2 篇文章 0 订阅

订阅专栏

监督学习（Supervised Learning）
监督学习是使用已知正确答案的示例来训练网络的。
步骤1：数据集的创建和分类
步骤2：训练
步骤3：验证
步骤4：使用
无监督学习（Unsupervised Learning）
无监督学习适用于具有数据集但无标签的情况。无监督学习采用输入集，并尝试查找数据中的模式。比如，将其组织成群（聚类）或查找异常值（异常检测）
无监督的学习技术：
— 自编码（Autoencoding）
—主成分分析（Principal components analysis）
— 随机森林（Random> forests）
— K均值聚类（K-means clustering）

无监督学习中最有前景的最新发展之一是Ian Goodfellow
半监督学习（Semi-supervised Learning）
半监督学习在训练阶段结合了大量未标记的数据和少量标签数据。与使用所有标签数据的模型相比，使用训练集的训练模型在训练时可以更为准确，而且训练成本更低
强化学习（Reinforcement Learning）
强化学习是针对再次没有标注数据集的情况而言的，但还是有办法来区分是否越来越接近目标（回报函数（reward function））。经典的儿童游戏——“hotter or colder”。（Huckle Buckle Beanstalk的一个变体）是这个概念的一个很好的例证。任务是找到一个隐藏的目标物件，然后你的朋友会喊出你是否越来越hotter（更接近）或colder（远离）目标物件。“hotter/colder”就是回报函数，而算法的目标就是最大化回报函数。可以把回报函数当做是一种延迟和稀疏的标签数据形式：而不是在每个数据点中获得特定的“right/wrong”答案，会得到一个延迟的反应，而它只会提示你是否在朝着目标方向前进。另外的例子就是训练狗狗的例子。

gaofeng2001_ren

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
【1】机器学习--概念篇

监督学习（Supervised Learning）监督学习是使用已知正确答案的示例来训练网络的。步骤1：数据集的创建和分类步骤2：训练步骤3：验证步骤4：使用无监督学习（Unsupervised Learning）无监督学习适用于具有数据集但无标签的情况。无监督学习采用输入集，并尝试查找数据中的模式。比如，将其组织成群（聚类）或查找异常值（异常检测）无监督的学习技术：
复制链接

扫一扫

专栏目录