统计学习第一章

最新推荐文章于 2022-05-22 21:55:00 发布

向上的研究僧

最新推荐文章于 2022-05-22 21:55:00 发布

阅读量106

点赞数

文章标签：统计学习基础

本文链接：https://blog.csdn.net/qq_43726771/article/details/117535382

版权

1.监督学习

定义：从标注数据中学习输入到输出的映射的统计规律。
用处：解决①回归问题（输入变量和输出变量均为连续变量）②分类问题（输出变量为有限个离散变量）③标注问题（输入输出变量均为变量序列，如情感分析问题）。
假设空间：监督学习的模型可以是概率模型或非概率模型，由条件概率分布P(Y|X)或Y=F(X)表示。

2.无监督学习

3.强化学习

定义：是指在智能系统在与环境的连续互动中学习最优行为策略的机器学习问题。
分类：分为无模型的方法（基于策略的、基于价值的）、有模型的方法（学习马尔可夫决策）
示例：智能系统与环境的互动：在每一步中，智能系统从环境中观测到一个状态与一个奖励，采取一个动作；环境根据智能系统选择的动作，决定下一步的状态和奖励。智能系统的目标不是短期奖励的最大化，而是长期累积奖励的最大化。

4.半监督学习

5.按照模型分类

6.按算法分类

7.按技巧分类

贝叶斯学习
又称为贝叶斯推理，主要思想：在概率模型的学习和推理中，利用贝叶斯定理，计算在给定数据条件下模型的条件概率，即后验概率，并应用这个原理进行模型的估计，以及对数据的预测。
核方法
定义：将线性模型扩展到非线性模型，直接做法是显式的定义从输入空间到特征空间的映射，在特征空间中进行内积运算。（关键：找到对应映射的核方法）
统计学习方法的三要素
模型：在监督学习过程中，模型就是所要学习的条件概率分布和决策函数。
策略：考虑用什么样的准则学习从而来选择最优模型。引入两个概念，期望风险：模型关于联合分布的期望损失；经验风险：模型关于训练样本集的平均损失。当N容量趋于无穷时，经验风险趋近于期望风险。当经验函数式子被确定时，就需要考虑经验风险最小化的问题。经验风险最小化就是求解最优的模型。在样本量足够大时，经验风险最小化能够很好的解决问题。但是在样本量不够大时，往往需要结构风险最小化方法来防止过拟合。
算法：考虑用什么样的计算方法求解模型。

补充

写于6.3号和6.4号

关注