监督学习与无监督学习

不做梵高417

已于 2023-12-15 11:13:48 修改

阅读量51

点赞数

文章标签：机器学习

于 2023-12-15 11:13:03 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_71778249/article/details/135012727

版权

监督学习算法的目的是找到一个映射函数来映射输入变量（x）和输出变量（y）。

监督学习的步骤

1.首先确定训练数据集的类型

2.收集/收集标记的训练数据（一般可能需要手动标记）

3.将训练数据集拆分为训练数据集、测试数据集和验证数据集。

4.确定训练数据集的输入特征，这些特征应该有足够的知识使模型能够准确地预测输出。

5.确定适合模型的算法，如支持向量机、决策树等。

6.在训练数据集上执行算法。有时我们需要验证集作为控制参数，它们是训练数据集的子集。

7.通过提供测试集来评估模型的准确性。如果模型预测出正确的输出，这意味着我们的模型是准确的。

监督机器学习算法的类型

监督学习可以进一步分为两类问题：回归和分类。

1.回归算法：
如果输入变量和输出变量之间存在关系，则使用回归算法。它用于预测连续变量，例如天气预报、市场趋势等。以下是一些流行的回归算法，它们属于监督学习：

线性回归
回归树
非线性回归
贝叶斯线性回归
多项式回归

2.分类算法：
当输出变量是分类时使用分类算法，这意味着有两个类别，例如是 - 否，男性 - 女性，真假等。垃圾邮件过滤，是否为垃圾等。

可能用到的算法：

随机森林
决策树
逻辑回归
支持向量机

无监督学习的目标是找到数据集的底层结构，根据相似性对数据进行分组，并以压缩格式表示该数据集。

无监督学习重要性的一些主要原因：

1.无监督学习有助于从数据中找到有用的见解。

2.无监督学习与人类通过自己的经验学习思考非常相似，这使得它更接近真正的人工智能。

3.无监督学习适用于未标记和未分类的数据，这使得无监督学习更加重要。

4.在现实世界中，我们并不总是有输入数据和相应的输出，因此为了解决这种情况，我们需要无监督学习。

无监督学习算法的类型

无监督学习算法可以进一步分为两类问题：聚类和关联

聚类：聚类是一种将对象分组为聚类的方法，使得具有最多相似性的对象保留在一个组中，并且与另一组的对象具有较少或没有相似性。聚类分析发现数据对象之间的共性，并根据这些共性的存在和不存在对它们进行分类。

关联：关联规则是一种无监督学习方法，用于查找大型数据库中变量之间的关系。它确定在数据集中一起出现的项目集。关联规则使营销策略更加有效。例如购买 X 商品（假设是面包）的人也倾向于购买 Y（黄油/果酱）商品。关联规则的一个典型例子是市场篮子分析。

无监督学习算法：

K-means 聚类
KNN（k-最近邻）
层次聚类
异常检测
神经网络
主成分分析
独立成分分析
先验算法
奇异值分解

不做梵高417

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。