统计学习导论之读书笔记（三）：分类（Classification）

最新推荐文章于 2024-08-16 07:34:13 发布

Liang_DJ

最新推荐文章于 2024-08-16 07:34:13 发布

阅读量2k

点赞数 1

分类专栏：机器学习文章标签：机器学习统计学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Liang_DJ/article/details/86014296

版权

本文介绍了分类问题中的逻辑斯谛回归和线性判别分析。逻辑斯谛回归关注二分类问题，通过对数几率转换实现概率建模；而线性判别分析适用于多分类，尤其在响应变量近似正态分布时表现稳定。文章对比了两种方法的适用场景，并探讨了R语言的实现方式。

摘要由CSDN通过智能技术生成

统计学习导论之读书笔记（三）：分类

1 分类问题概述

分类模型(classifier)是一种用来预测定性响应变量的方法。我们将讨论三种应用最广泛的分类方法：洛吉斯蒂回归(logistic regression)、线性判别分析（linear discriminant analysis, LDA）和K最近邻(KNN)

2 为什么线性回归不可用

线性回归在预测定性响应变量下是不可用的，原因：通常我们不能将一个定性的响应变量自然地转化为两水平以上地定量变量来建立线性回归模型。(这样做实际会默认一个有序地输出)。

对一个二元响应变量，最小二乘回归是有意义的。但它的估计值很可能在[0,1]之外，这个数值难以被当作概率来解释。（注意线性回归产生的估计实际上是 $Pr(Y=Y_{j}|X)$ 的估计）。

3 逻辑斯谛回归(二分类问题)

我们通常会更关心Y属于某一类的概率，逻辑斯谛回归是对 $Y$ 属于某一类的概率建模而不直接对响应变量 $Y$ 建模。

3.1逻辑斯谛模型

逻辑斯谛函数为：

$\ p(X) = \frac{\epsilon^{\beta_{0}+\beta_{1}X}}{1+\epsilon^{\beta_{0}+\beta_{1}X}}\,$

对上述两边取对数，可以得到：

$\ log(\frac{p(X)}{1-p(X)})= \beta_{0}+\beta_{1}X\,$

所以，上式左边称为对数发生比(log-odd)或分对数(logit),逻辑斯谛回归模型可以视为分对数变换下关于 $X$ 的一个线性模型。

3.2 估计回归系数

估计回归系数使用的方法是：极大似然估计，即最大化似然函数：

最低0.47元/天解锁文章

关注

1
点赞
踩
13

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。