机器学习基本分类概述

本文概述了机器学习的三个主要分支:监督学习(包括回归和分类问题)、无监督学习(如聚类和降维)以及强化学习(智能系统通过与环境交互学习策略)。作者引用了李航的《统计学习方法》一书作为参考。
摘要由CSDN通过智能技术生成

机器学习基本分类概述

监督学习

定义:从标注数据中学习预测模型的机器学习问题

标注数据 → \rightarrow 输入输出对应关系
预测模型 → \rightarrow 对给定输入产生相应的输出

本质:学习输入到输出的映射的统计规律

应用:

  • 回归问题:输入变量和输出变量均为连续变量的预测问题
  • 分类问题:输出变量为有限个离散变量的预测问题
  • 标注问题:输入变量和输出变量均为变量序列的预测问题

无监督学习

定义:从无标注数据中学习预测模型的机器学习问题

无标注数据 → \rightarrow 自然得到的数据
预测模型 → \rightarrow 数据的类别、转换或概率

本质:学习数据中的统计规律或潜在结构

应用:

  • 聚类:数据纵向结构,将样本集合中相似的样本分配到相同的类,不相似的样本分配到不同的类
  • 降维:数据横向结构,将训练数据中的样本从高维空间转换到低维空间
  • 概率模型估计:数据横向纵向结构,假设训练数据由一个概率模型生成,由训练数据学习概率模型的结构和参数

强化学习

定义:智能系统在与环境的连续互动中学习最优行为策略的机器学习问题

本质:学习最优的序贯决策

目标:在所有可能的策略中选出价值最大的策略,而在实际学习中往往从具体策略出发,不断优化已有策略

智能系统与环境互动如下图所示,每一步t,智能系统从环境中观测到一个状态st与一个奖励rt,采取一个动作at。环境根据智能系统选择的动作,决定下一步t+1的状态st+1与奖励rt+1
智能系统与环境的互动
参考书籍:《统计学习方法》李航

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值