Logistic回归——二分类 —— matlab

洋洋菜鸟

已于 2022-03-29 21:11:27 修改

阅读量1.5w

点赞数 13

分类专栏：机器学习文章标签：分类回归机器学习

于 2022-03-25 12:32:48 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_25990967/article/details/123518959

版权

目录

4.1 sigmod分类函数

4.2 建立目标函数

4.3 求解相关参数

5.1 读取数据（excel文件）

5.2 分离数据集

5.3 求解前设定

5.4 求解目标函数

5.6 预测分类

6.matlab自带函数

1.简介

Logistic回归又称logistic回归分析，是一种广义的线性回归分析模型，常用于数据挖掘，Logistic回归虽说是回归，但实际更属于判别分析。

2.应用范围

① 适用于流行病学资料的危险因素分析

② 实验室中药物的剂量-反应关系

③ 临床试验评价

④ 疾病的预后因素分析

3.分类

①按因变量的资料类型分：

二分类

多分类

其中二分较为常用

② 按研究方法分：

条件Logistic回归

非条件Logistic回归

两者针对的资料类型不一样，前者针对配对研究，后者针对成组研究。

3.应用条件

① 独立性。各观测对象间是相互独立的；

② LogitP与自变量是线性关系；

③ 样本量。经验值是病例对照各50例以上或为自变量的5-10倍（以10倍为宜），不过随着统计技术和软件的发展，样本量较小或不能进行似然估计的情况下可采用精确logistic回归分析，此时要求分析变量不能太多，且变量分类不能太多；

④ 当队列资料进行logistic回归分析时，观察时间应该相同，否则需考虑观察时间的影响（建议用Poisson回归）。

4.原理详解

4.1 sigmod分类函数

之所以在这里介绍，是因为下面会用到这个函数

Sigmoid函数：

$\large h_{w}=\frac{1}{1+e^{-z}}$

曲线表示：

由图可见当范围为0-1,当X<0时，Y趋向于0，X>0时，Y趋向于1，适合用于0-1二分类。

所以我们就可以设分类函数如下：

$\large h_{w}=\frac{1}{1+e^{-z}}$

$\large z=\omega ^{T}x$

$\large x=\begin{bmatrix} 1,x_{1},x_{2},...,x_{n}\end{bmatrix}$

$\large z=w_{0}+w_{1}x_{1}+...+w_{n}x_{n}$

其中 $x$ 为自变量，即特征数据。实际因变量为 $y$ ，为0-1变量, $h_w$ 为预测值范围为0-1。显然这个模型需要求解的变量为 $w$ 。

4.2 建立目标函数

对于输入变量 $x$ ，设 $h_w(x)$ 为输出为1的概率，则 $1-h_w(x)$ 为输出0的概率。则可表示成如下：

$\large p(y=1|x;w)=h_{w}(x)$

$\large p(y=0|x;w)=1-h_{w}(x)$

求解损失函数：用概率论中的极大似然估计的方法，构建概率函数如下，

最低0.47元/天解锁文章

博客等级

码龄10年

292
原创

2228
点赞

1万+
收藏

2104
粉丝

关注

私信

热门文章

分类专栏

展开全部收起

最新评论

最全python爬虫库安装详解
北风之神c: 总结的很全面的爬虫，写得赞，博主用心了。此国产分布式函数调度框架 funboost python万能通用函数加速器 https://funboost.readthedocs.io/zh-cn/latest/articles/c8.html ，只需要@boost一行代码，加到任意新/旧爬虫项目就又强又自由又简单。 funboost 分布式函数调度框架，定位于调度用户的任何函数，只要用户在函数里面写爬虫代码，就可以分布式调度爬虫，此框架如果用于爬虫，不管从任何方面比较可以领先scrapy 20年，也比任意写的爬虫框架领先10年。普通爬虫框架一般就设计为url请求调度框架，url怎么请求都是被框内置架束缚死了，所以有些奇葩独特的想法在那种框架里面难以实现，用户需要非常之精通框架本身然后改造框架才能达到随心所欲的驾驭的目的。普通的爬虫框架与用户手写requests 请求解析存储，在流程逻辑上是严重互斥的，要改造成使用那种框架改造需要大改特改。而此框架是函数调度框架，函数里面用户可以随意写一切任意自由想法，天生不会有任何束缚。与用户使用别的爬虫框架或者无框架用户手写多线程爬虫相比， funboost都代码更少更强更简单更自由。 pip install boost_spider (powerd by funboost ，boost_spider比funboost增加了更加专门的针对爬虫请求和解析和存储） https://github.com/ydf0509/boost_spider 依托于funboost的强大可视化管理，不登录机器可以轻松掌控分布式大规模爬虫运行状态，一目了然。可视化截图： https://funboost.readthedocs.io/zh-cn/latest/articles/c13.html
整数线性规划实现（matlab分枝界定法）
2401_84443789: 这个代码用什么软件可以执行
主成分分析（PCA）及其可视化——python
IParanoea: 我想的是不排序，只比较大小，找出前两位的特征值及相应的特征向量，不知道您是不是还有其他方法
粒子群优化(PSO)算法例题实现
云边小卖部～: 就是没有写这个函数
智能计算之蚁群算法(ACO)介绍
yanxiaoyu110: 这是哪本书啊

最新文章

目录

展开全部

收起

评论 5

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。