统计学习方法及监督学习

最新推荐文章于 2022-09-06 18:16:43 发布

sunflower_level2

最新推荐文章于 2022-09-06 18:16:43 发布

阅读量1k

点赞数 1

文章标签：机器学习监督学习

本文链接：https://blog.csdn.net/agent_snail/article/details/104418762

版权

§1.1 统计学习（statistical learning）

又称统计机器学习，目的是：对数据进行分析或预测。统计学习关于数据的基本假设是同类数据具有一定的统计规律性，可以用概率统计的方法处理。

§1.2 统计学习分类

♧1.2.1 基本分类

统计学习或强化学习一般包括监督学习、无监督学习和强化学习。有时还包括半监督学习和主动学习。

♡1 监督学习

本质是学习输入到输出的映射的统计规律。 每个具体的输入实例是一个特征，所有特征组成特征空间，输入空间不同于特征空间时，应将输入空间映射到特征空间。
输入变量和输出变量为连续变量的预测问题为回归问题；输入变量和输出变量为离散变量的预测问题为分类问题；输入变量和输出变量为序列的预测问题为标注问题。
基本假设：输入和输出的随机变量具有联合概率分布。
假设空间（hypothesis space）：由输入空间到输出空间的映射集合。假设空间确定代表着学习范围确定。监督学习的模型分为概率模型和非概率模型。模型描述出输入与输出随机变量之间的映射关系。

♡2 无监督学习

从无标注的数据中学习预测模型。本质是学习数据中的统计规律或潜在结构。 输出由输入的类别、转换、概率表示。模型对数据进行：聚类、降维、或概率统计。

♡3 强化学习

指智能体在与环境的连续互动中学习最优行为策略的机器学习，基于马尔科夫决策过程，智能系统观测的是与环境互动得到的数据序列。
需要强调的是Q-function和value function的区别：Q-function是基于当前状态和动作的而value function是基于当前状态的。
还有就是强化学习的方法：model-based和model-free（包括：优化policy和优化value两种方法）。
详细内容