机器学习——监督学习和无监督学习

什么是机器学习?

机器学习 Machine learning (ML) is a branch of artificial intelligence (AI) and computer science that focuses on the using data and algorithms to enable AI to imitate the way that humans learn, gradually improving its accuracy.

是人工智能的一个子领域,专注于使用数据集训练机器学习算法,以生成能够执行复杂任务的机器学习模型,例如对图像进行排序、预测销售或分析大数据。

什么情况下使用机器学习?

The first step to determine if (and which) machine learning method(s) to use is specifying one’s research question. Using Hernán and colleagues’ framework, there are three major data science research tasks: description, prediction, and causal inference

主要解决三个问题:描述,预测以及因果推断

机器学习分为监督学习和无监督学习

监督学习:Supervised learning

Supervised learning is an approach to machine learning (ML) that uses labeled datasets and correct outputs to train learning algorithms how to classify data or predict an outcome.

它是一个机器学习的方法。用数据集和正确的输出来训练学习程序,让程序可以分类数据或者预测出一个结果。

在数据挖掘时,监督学习可以分为两类问题:分类和回归

标签数据

Occasionally, it is also referred to as Learning with a Teacher, Learning from Labeled Data, or Inductive Machine.

Kotsiantis, S. (2007). Supervised machine learning: A review of classification techniques. Informatica Journal, 31, 249–268.

同义词

Synonyms

Active learning; Classification; Inductive machine learning; Learning from labeled data; Learning with a teacher; Regression; Semi-supervised learning; Supervised machine learning

定义

Definition

Supervised Learning is a machine learning paradigm(范式) for acquiring the input-output relationship information of a system based on a given set of paired input-output training samples.(基于输入与输出(自变量与因变量)训练) As the output is regarded as the label of the input data or the supervision, an input-output training sample is also called labeled training data, or supervised data. 由于输出被视为输入数据或监督的标签,因此输入输出训练样本也称为标记训练数据或监督数据。

The goal of supervised learning is to build an artificial system that can learn the mapping between the input and the output, and can predict the output of the system given new inputs. 监督学习的目标是建立一个人工系统,该系统可以学习输入和输出之间的映射,并可以预测给定新输入的系统输出。

无监督学习

无监督学习:使用机器学习算法来分析和聚类未标记的数据集。这些算法在不需要人工干预的情况下发现数据中的隐藏模式(因此,它们是无监督的)。

无监督学习模型用于三个主要任务:聚类(Clustering)、关联(Association)和降维(Dimensionality reduction

总结

监督学习是人给它一个标准或者定义,之后让他自己去学习。核心在于标签数据。同时需要拟合成功。无监督学习使用未标记的数据。从这些数据中,它发现有助于解决聚类或关联问题的模式。无监督学习是依靠机器学习算法来找到隐藏的关系,但是依然需要研究人员自己弄。

不同:

监督两者之间的最大区别在于使用标记数据集。无监督学习的目标是识别数据结构中的基础维度、组件、集群或轨迹相比之下,无监督学习不需要标记的数据集。相反,它会检测数据中的模式,并按任何显着特征对它们进行聚类目标。

在监督学习中,目标是预测新数据的结果。您预先知道预期的结果类型。使用无监督学习算法,目标是从大量新数据中获取新见解。机器学习本身决定了与数据集的不同之处或有趣之处。

  • 26
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值