统计学习方法-李航（6）

最新推荐文章于 2024-04-06 17:01:29 发布

萌即正义Zitrone

最新推荐文章于 2024-04-06 17:01:29 发布

阅读量169

点赞数

分类专栏：统计学习方法-李航文章标签：统计学习方法-李航（6）

本文链接：https://blog.csdn.net/qq_35629171/article/details/84946189

版权

统计学习方法-李航专栏收录该内容

6 篇文章 1 订阅

订阅专栏

统计学习方法-李航（6）

分类问题
- 评价指标
标注问题
- 过程
- - 学习
  - 标注
回归问题
- 过程

分类问题

在监督学习中，当输出变量Y取有限个离散值时，预测问题便成为分类问题。
分类问题包括学习和分类两个过程。

评价指标

$T P$ ——将正类预测为正类数
$F N$ ——将正类预测为负类数
$F P$ ——将负类预测为正类数
$T N$ ——将负类预测为负类数
精确率： $P=\frac{TP}{TP+FP}$
召回率： $R=\frac{TP}{TP+FN}$
1F值：（精确率和召回率的调和均值）
$\frac{2}{F_1}=\frac{1}{P}+\frac{1}{R}$
$F_1=\frac{2TP}{2TP+FP+FN}$
精确率和召回率都高时， $F 1$ 值也会高
Z.B.
k近邻法、感知机、朴素贝叶斯法、决策树、决策列表、逻辑斯谛回归模型、支持向量机、提升方法、贝叶斯网络、神经网络、 Winnow

标注问题

标注问题是分类问题的一个推广
标注问题的输入是一个观测序列，输出是一个标记序列或状态序列。标注问题的目标在于学习一个模型，使它能够对观测序列给出标记序列作为预测。注意，可能的标记个数是有限的，但其组合所成的标记序列的个数是依序列长度呈指数级增长的。

过程

标注问题分为学习和标注两个过程

学习

$T={(x_1,y_1),(x_2,y_2),...,(x_N,y_N)}$
基于学习构建一个模型，表示为条件概率分布： $P(Y^{(1)},Y^{(2)},...,Y^{n}|X^{(1)},X^{(2)},...,X^{(n)})$

标注

对一个观测序列 $x_{N+1}=(x_{N+1}^{(1)},x_{N+1}^{(2)},...,x_{N+1}^{(n)})^T$ ，找到使条件概率 $P((y_{N+1}^{(1)},y_{N+1}^{(2)},...,y_{N+1}^{(n)}),(x_{N+1}^{(1)},x_{N+1}^{(2)},...,x_{N+1}^{(n)})^T)$ 最大的标记序列 $y_{N+1}=(y_{N+1}^{(1)},y_{N+1}^{(2)},...,y_{N+1}^{(n)})^T$
Z.B.
隐马尔可夫模型、条件随机场

回归问题

选择一条函数曲线使其很好地拟合已知数据且很好地预测未知数据

过程

回归问题分为学习和预测两个过程
回归学习最常用的损失函数是平方损失函数，在此情况下，回归问题可以由著名的最小二乘法（least squares）求解。

萌即正义Zitrone

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习方法-李航（6）

统计学习方法-李航（6）分类问题评价指标标注问题过程学习标注回归问题过程分类问题在监督学习中，当输出变量Y取有限个离散值时，预测问题便成为分类问题。分类问题包括学习和分类两个过程。评价指标TPTPTP——将正类预测为正类数FNFNFN——将正类预测为负类数FPFPFP——将负类预测为正类数TNTNTN——将负类预测为负类数精确率：P=TPTP+FPP=\frac{TP}{TP+...
复制链接

扫一扫

专栏目录