统计学习方法——第1章-概述

Alexa2077

已于 2022-09-18 16:15:40 修改

阅读量393

点赞数

分类专栏：统计学习方法文章标签：学习机器学习人工智能

于 2022-09-18 16:14:55 首次发布

本文链接：https://blog.csdn.net/Alexa_/article/details/126917447

版权

统计学习方法专栏收录该内容

4 篇文章 0 订阅

订阅专栏

1.1统计学习

1.1.1 统计学习的特点:
统计学习(Statistical Learning):关于计算机基于数据构建概率统计模型并运用模型对数据进行预测与分析。

1.1.2 统计学习方法
由监督学习，无监督学习，强化学习，自主学习等的组成。

1.1.3 统计学习三要素
模型(model),策略(strategy),算法(algorithm)

1.2统计学习分类

1.2.1 监督学习

监督学习(supervised learning):指从标注数据中学习预测模型的机器学习问题。
每个输入是一个实例(instance),通常由特征向量(feature vector)表示。
特征向量存在的空间叫做特征空间(feature space)。

input 连续，output 连续 = 》回归问题
output 有限个离散变量的预测问题 =》分类问题
input ,output 为变量序列的预测问题 =》标注问题

形式：分为两个过程。
训练模型：利用训练数据集学习出模型
测试模型：利用模型对测试样本集进行预测

1.2.2 无监督学习

无监督学习(unsupervised learning):指从无标注数据中学习预测模型的机器学习问题。其本质是学习数据中的统计规律和潜在结构。
无标注数据：自然得到的数据，预测模型表示数据的类别，转换或概率。

1.2.3 强化学习

强化学习(reinforcement learning):指智能系统在与环境的连续互动中学习最优行为策略的机器学习问题。

专有名词：
状态 state,奖励 reward，动作action ，试错 trial and error
价值函数 value function
动作价值函数 action value function

1.2.4 半监督与主动学习

半监督学习(semi-supervised learning):利用标注和未标注的数据学习预测模型的机器学习问题。通常少量标注数据，大量未标注数据。

主动学习(active learning)：机器不断主动的给出实例让教师进行标注，然后利用标注的数据学习预测模型的机器学习问题。以较小的标注代价，达到较好的学习效果。

1.3 按模型分类：

1.3.1 概率模型与非概率模型

概率模型(probabilistic model)
决策树，朴素贝叶斯，隐马尔可夫，条件随机场，概率潜在语义分析，潜在迪利克雷分配，高斯混合模型
非概率模型(non-probabilistic model)
感知机，支持向量机，K近邻，AdaBoost，k均值，潜在语义分析，神经网络

逻辑斯蒂回归即可看作概率模型，有可看作非概率模型。

在监督学习中，概率模型取条件概率分布 P(y|x),非概率模型取 y=f(x)
在无监督学习中，概率模型取条件概率分布 P(z|x)，非概率模型取函数形式 z=g(x)
条件概率分布 P(y|x) 和函数 z=f(x) 可以相互转化