【AI-17】有监督学习和无监督学习的区别

无监督学习任务、有监督学习任务和半监督学习任务的区分方式

  1. 有监督学习任务:
    特点:数据集中的每个样本都有明确的标签或目标值。
    目的:模型通过学习输入特征与已知标签之间的关系,能够对新的、未见过的输入数据进行准确的标签预测。
    示例:图像分类(给定大量带有“猫”“狗”等标签的图片来训练模型,使其能够对新的图片判断所属类别)、房价预测(已知房屋的各种特征及对应的价格,预测新房屋的价格)。
    常见算法:决策树、支持向量机、神经网络等。
    有监督学习任务步骤:
    数据收集:获取包含输入特征和对应目标标签的数据集。
    数据预处理:包括数据清洗、数据归一化、处理缺失值等。
    特征工程:选择和提取有意义的特征,或者对原始特征进行转换和组合。
    划分数据集:将数据集分为训练集、验证集和测试集。
    选择模型:根据问题类型和数据特点选择合适的模型,如线性回归、决策树、神经网络等。
    训练模型:使用训练集数据对模型进行训练,通过优化算法调整模型参数以最小化损失函数。
    模型评估:在验证集上评估模型性能,如计算准确率、召回率、均方误差等指标。
    超参数调整:基于评估结果,调整模型的超参数,如学习率、层数等。
    最终测试:在测试集上测试模型,得到最终的性能评估。

  2. 无监督学习任务:
    特点:数据集中的样本没有预先给定的标签或目标值。
    目的:模型从数据中自动发现模式、结构或规律。
    示例:聚类(将数据集中相似的数据点归为一组,如根据用户的消费行为对用户进行分组)、降维(将高维数据映射到低维空间以发现数据的内在结构,如主成分分析)。
    常见算法:K-Means 聚类、层次聚类、主成分分析等。
    无监督学习任务步骤:
    数据收集:获取数据集。
    数据预处理:与有监督学习类似,进行数据清洗和预处理。
    选择算法:根据任务需求选择无监督学习算法,如聚类算法(K-Means、层次聚类等)、降维算法(PCA 等)。
    应用算法:使用所选算法对数据进行处理。
    结果评估:通过一些内部评估指标(如聚类中的轮廓系数)或可视化来评估结果的质量。
    调整参数:如果结果不理想,调整算法的参数重新运行。

  3. 半监督学习任务:
    特点:数据集中只有一部分样本有标签,而大部分样本没有标签。
    目的:利用少量有标签数据和大量无标签数据来训练模型,提高模型的性能。
    示例:在只有部分图片有类别标注的情况下,对大量未标注的图片进行分类学习。
    常见算法:基于图的半监督学习、自训练等。
    半监督学习任务步骤
    数据收集:获取包含少量有标签数据和大量无标签数据的数据集。
    数据预处理:同前。
    特征工程:同有监督学习。
    划分数据集:一般分为有标签的训练集、无标签的训练集、验证集和测试集。
    选择模型:适合半监督学习的模型,如基于图的模型、自训练模型等。
    初步训练:使用有标签数据训练模型。
    利用无标签数据:通过一些策略(如基于模型预测为无标签数据赋予伪标签)来利用无标签数据改进模型。
    模型评估与调整:在验证集上评估,调整超参数。
    最终测试:在测试集上测试模型性能。

例如,假设有一个包含水果图像的数据集:
如果每个水果图像都明确标有“苹果”“香蕉”“橙子”等标签,这就是有监督学习任务,模型学习根据图像特征来识别水果的类别。
如果这些图像都没有任何标签,让模型自己去发现相似的图像组,这就是无监督学习任务,可能会发现某些组的图像具有相似的颜色、形状等特征。
而如果只有一部分图像有标签,其余大部分没有,要利用这些部分有标签和大量无标签的数据来训练模型,这就是半监督学习任务。

回归属于哪一类?

在 AI 中,回归是一种监督学习任务。
简单来说,回归的目的是预测一个连续的数值。
例如,预测房屋的价格、股票的未来价格、气温的变化值等。
回归模型试图建立输入特征(也称为自变量)与输出数值(也称为因变量)之间的数学关系。
常见的回归算法包括线性回归、多项式回归、岭回归、Lasso 回归等。
以简单的线性回归为例,它假设输入特征和输出数值之间存在存在线性关系,通过最小化预测值和实际值之间的误差来确定最佳的直线方程(也就是模型的参数)。
假设我们要根据房屋的面积来预测房价,面积就是输入特征,房价就是要预测的连续数值。通过收集大量的房屋面积和对应的房价数据来训练回归模型,模型学习到面积和房价之间的潜在规律,从而能够对新的房屋面积给出合理的房价预测。
再比如,根据历史上每天的气温、湿度、风速等数据来预测明天的最高气温,这也是一个回归问题。

强化学习属于哪一类?

强化学习不属于有监督和无监督学习。
强化学习是一种独立的学习范式,与有监督学习和无监督学习有所不同。
在强化学习中,智能体通过与环境进行交互,根据环境给出的奖励信号来学习最优的策略,以使累积的奖励最大化。
强化学习中的数据并非像有监督学习那样有明确的输入与输出的对应关系,也不像无监督学习那样没有任何的反馈或监督信号。
它有自己独特的特点和方法,例如通过试错来探索不同的行动,根据奖励来优化策略等。
所以,强化学习不属于无监督学习,而是一种独特的机器学习类型。

  • 11
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值