李航《统计学习方法（第二版）》笔记：第一章——统计学习及监督学习概论（一）

最新推荐文章于 2022-07-21 16:31:32 发布

公户灿灿

最新推荐文章于 2022-07-21 16:31:32 发布

阅读量487

点赞数 1

文章标签：算法

本文链接：https://blog.csdn.net/weixin_45507954/article/details/108360253

版权

本文深入探讨统计学习的概念，包括监督学习、无监督学习、强化学习和半监督学习的基本分类。监督学习是通过标注数据学习输入到输出的映射，如分类和回归问题；无监督学习则从无标注数据中学习统计规律。统计学习方法的三要素是模型、策略和算法，其目的是构建概率统计模型，以进行预测和分析。

摘要由CSDN通过智能技术生成

赫尔伯特·西蒙：“如果一个系统能够通过执行某个过程改进他的性能，这就是学习。”

统计学习的对象：数据，包括数字、文字、图像、视频、音频及它们的组合。
统计学习的目的：基于数据构建概率统计模型，获得对数据的准确的预测（使计算机智能化）与分析（获取新知识新发现）。要考虑学习什么样的模型，如何学习模型，怎样提高学习效率。
统计学习的方法：监督学习（supervised learning）——分类、标注、回归；无监督学习（unsupervised learning）；强化学习（reinforcement learning）

定义：需要标注的训练数据集，学习一个由输入到输出的映射（以模型表示），来进行预测。
基本元素：输入空间X、特征空间、输出空间Y
根据输入输出变量的不同类型（连续/离散/序列），把预测任务分类为：
输入变量与输出变量为连续变量的预测问题——回归问题
输出变量为有限个离散变量的预测问题——分类问题
输入变量与输出变量均为变量序列的预测问题——标注问题
前提假设：X和Y具有联合概率分布，即存在分布（密度）函数P(X,Y)
统计学习的目的就是找到两个随机变量的联合概率分布P(X,Y)
联合密度分布参考：https://blog.csdn.net/qq_39636214/article/details/85036837
可以是概率模型或非概率模型，由条件概率分布P(Y|X)或决策函数（decision function）Y=f(X)表示，随具体学习方法而定。

关注