机器学习基本分类概述
监督学习
定义:从标注数据中学习预测模型的机器学习问题
标注数据
→
\rightarrow
→输入输出对应关系
预测模型
→
\rightarrow
→对给定输入产生相应的输出
本质:学习输入到输出的映射的统计规律
应用:
- 回归问题:输入变量和输出变量均为连续变量的预测问题
- 分类问题:输出变量为有限个离散变量的预测问题
- 标注问题:输入变量和输出变量均为变量序列的预测问题
无监督学习
定义:从无标注数据中学习预测模型的机器学习问题
无标注数据
→
\rightarrow
→自然得到的数据
预测模型
→
\rightarrow
→数据的类别、转换或概率
本质:学习数据中的统计规律或潜在结构
应用:
- 聚类:数据纵向结构,将样本集合中相似的样本分配到相同的类,不相似的样本分配到不同的类
- 降维:数据横向结构,将训练数据中的样本从高维空间转换到低维空间
- 概率模型估计:数据横向纵向结构,假设训练数据由一个概率模型生成,由训练数据学习概率模型的结构和参数
强化学习
定义:智能系统在与环境的连续互动中学习最优行为策略的机器学习问题
本质:学习最优的序贯决策
目标:在所有可能的策略中选出价值最大的策略,而在实际学习中往往从具体策略出发,不断优化已有策略
智能系统与环境互动如下图所示,每一步t,智能系统从环境中观测到一个状态st与一个奖励rt,采取一个动作at。环境根据智能系统选择的动作,决定下一步t+1的状态st+1与奖励rt+1。
参考书籍:《统计学习方法》李航