监督学习与无监督学习

监督学习算法的目的是找到一个映射函数来映射输入变量(x)和输出变量(y)。

监督学习的步骤

1.首先确定训练数据集的类型

2.收集/收集标记的训练数据(一般可能需要手动标记)

3.将训练数据集拆分为训练数据集、测试数据集和验证数据集。

4.确定训练数据集的输入特征,这些特征应该有足够的知识使模型能够准确地预测输出。

5.确定适合模型的算法,如支持向量机、决策树等。

6.在训练数据集上执行算法。有时我们需要验证集作为控制参数,它们是训练数据集的子集。

7.通过提供测试集来评估模型的准确性。如果模型预测出正确的输出,这意味着我们的模型是准确的。

监督机器学习算法的类型

监督学习可以进一步分为两类问题:回归和分类。

1.回归算法:
如果输入变量和输出变量之间存在关系,则使用回归算法。它用于预测连续变量,例如天气预报、市场趋势等。以下是一些流行的回归算法,它们属于监督学习:

  • 线性回归
  • 回归树
  • 非线性回归
  • 贝叶斯线性回归
  • 多项式回归

2.分类算法:
当输出变量是分类时使用分类算法,这意味着有两个类别,例如是 - 否,男性 - 女性,真假等。垃圾邮件过滤,是否为垃圾等。

可能用到的算法:

  • 随机森林
  • 决策树
  • 逻辑回归
  • 支持向量机

无监督学习的目标是找到数据集的底层结构,根据相似性对数据进行分组,并以压缩格式表示该数据集。

无监督学习重要性的一些主要原因:

1.无监督学习有助于从数据中找到有用的见解。

2.无监督学习与人类通过自己的经验学习思考非常相似,这使得它更接近真正的人工智能。

3.无监督学习适用于未标记和未分类的数据,这使得无监督学习更加重要。

4.在现实世界中,我们并不总是有输入数据和相应的输出,因此为了解决这种情况,我们需要无监督学习。

无监督学习算法的类型

无监督学习算法可以进一步分为两类问题:聚类和关联

聚类:聚类是一种将对象分组为聚类的方法,使得具有最多相似性的对象保留在一个组中,并且与另一组的对象具有较少或没有相似性。聚类分析发现数据对象之间的共性,并根据这些共性的存在和不存在对它们进行分类。

关联:关联规则是一种无监督学习方法,用于查找大型数据库中变量之间的关系。它确定在数据集中一起出现的项目集。关联规则使营销策略更加有效。例如购买 X 商品(假设是面包)的人也倾向于购买 Y(黄油/果酱)商品。关联规则的一个典型例子是市场篮子分析。

无监督学习算法:

  • K-means 聚类
  • KNNk-最近邻)
  • 层次聚类
  • 异常检测
  • 神经网络
  • 主成分分析
  • 独立成分分析
  • 先验算法
  • 奇异值分解
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值