（统计学习方法|李航）第一章统计学习方法概论七八九十节——生成模型与判别模型，分类问题，标注问题，回归问题

Allenspringfestival

已于 2023-08-10 22:10:56 修改

阅读量477

点赞数

分类专栏：机器学习基础文章标签：学习方法

于 2023-08-07 09:39:37 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_57848728/article/details/132139946

版权

机器学习基础专栏收录该内容

13 篇文章 2 订阅

订阅专栏

目录

一，生成模型与判别模型

二，分类问题

三，标注问题

四，回归问题

一，生成模型与判别模型

P（X,Y）是联合概率分布

只要是出现联合概率分布，就一定是生成模型

这里的P(Y|X)表示的是以X为条件Y的概率分布

隐马尔可夫模型时间上是一个时间序列的生成模型

判别方法就是直接去求概率

生成模型VS判别模型

生成模型需要大量的数据将小狗和大象进行分类
判别模型只需要利用差别去分类就可以了

比如说：
可以用特征鼻子的长度去判断是大象还是小狗——生成模型

需要收集耳朵，尾巴，脚等一系列特征去判断是大象还是小狗——判别模型

监督学习的应用：分类问题，标注问题，回归问题

二，分类问题

当输入变量和输出变量

均为离散变量为分类问题
均为变量序列为标注问题
均为连续变量为回归问题

输出的类别（class）

评估分类器性能的指标一般是分类准确率

其定义是：对于给定的测试数据集，分类器正确分类的样本数和总样本数之比，也就是损失函数是0-1损失时候，测试数据集上的准确率。

true positive

false negative

前面的TF（代表的是预测正确与否）

后面的PN(代表的是预测数是正类数还是负类数)

画图更好记：
background：
根据特征值预测是否会被女孩子喜欢，

结果中预测正确的就是predict（精确率）（预测正确里面有多少是正确的）
在被女孩子喜欢的人中被预测出来的就是true（召回率）（所有正确的人里面召回了多少）

三，标注问题

标注问题也是一个监督学习问题。可以认为标记问题是分类问题的一个推广。

标注问题的输入是一个观测序列，输出的是一个标记序列或状态序列。也就是说，分类问题的输出是一个值，而标注问题输出是一个向量，向量的每个值属于一种标记类型。

标注常用的机器学习方法有：隐性马尔可夫模型、条件随机场。

模型可以是条件概率的形式也可以是决策函数的形式

输入与输出均为22个序列
名词标注为E,形容词标注为B,其他标注为O

四，回归问题

回归用于预测输入变量和输出变量之间的关系：

特别是当输入变量的值发生变化时，输出变量的值随之发生的变化。

回归模型正是表示从输入变量到输出变量之间映射的函数。
回归问题的学习等价于函数拟合：

选择一条函数曲线使得很好地拟合已知数据且很好地拟合已知数据且很好地预测未知数据。
回归问题按照输入变量的个数，分为一元回归和多元回归；
按照输入变量和输出变量之间关系的类型即模型的类型，分为线性回归和非线性回归。

回归学习最常用的损失函数是平方损失函数，在此情况下，回归问题可以用最小二乘法求解。

Allenspringfestival

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
（统计学习方法|李航）第一章统计学习方法概论七八九十节——生成模型与判别模型，分类问题，标注问题，回归问题

目录一，生成模型与判别模型二，分类问题三，标注问题四，回归问题
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。