R-多分类logistic回归（机器学习）

辣椒种子

于 2024-01-07 10:19:10 发布

阅读量1.7k

点赞数 36

分类专栏：机器学习文章标签：机器学习 r语言分类

本文链接：https://blog.csdn.net/lijunhcn/article/details/135436621

版权

机器学习专栏收录该内容

97 篇文章 2 订阅 ¥49.90 ¥99.00

订阅专栏

超级会员免费看

本文介绍了如何使用R中的DALEX包处理多分类问题，通过随机森林模型分析HR数据，探讨了变量重要性、边际效应以及个体预测，展示了如何解释复杂模型的结果。

摘要由CSDN通过智能技术生成

多分类logistic回归

在之前文章介绍了，如何在R里面处理多分类的回归模型，得到的是各个因素的系数及相对OR，但是解释性，比二元logistic回归方程要冗杂的多。

那么今天继续前面的基础上，用机器学习的方法来解释多分类问题。
其实最终回归到这类分类问题的本质：有了一系列的影响因素x，那么根据这些影响因素来判断最终y属于哪一类别。

image.png

1.数据案例

这里主要用到DALEX包里面包含的HR数据，里面记录了职工在工作岗位的状态与年龄，性别，工作时长，评价及薪水有关。根据7847条记录来评估，如果一个职工属于男性，68岁，薪水及评价处于3等级，那么该职工可能会处于什么状态。

library(DALEX)
library(iBreakDown)
library(car)
library(questionr)
try(data(package="DALEX"))
data(HR)

# split
set.seed(543)
ind = sample(2,nrow(HR),replace=TRUE,

了解本专栏

订阅专栏解锁全文

超级会员免费看

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

辣椒种子

关注关注

36
点赞
踩
31

收藏

觉得还不错? 一键收藏
打赏
10
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

订阅专栏

R实现多分类logistic回归

学习中

01-03

1986

R实现多分类logistic回归

R语言进行无序多分类Logistic回归

最新发布

dege857的博客

09-11

638

在临床研究中，接触最多的是二分类数据，如淋巴癌是否转移，是否死亡，这些因变量最后都可以转换成二分类0与1的问题。更改了参考类别后，咱们使用prog2为结局变量建立无序多分类逻辑回归模型，很多包可以建立这个模型，我这里用vglm包来建，我觉得比较简单点。这个数据是高中生毕业后的一个就业计划数据，Prog是结局变量，是个三分类变量，预测变量是ses社会经济地位，其他的是一些协变量。还可以做交互效应的，把交互效应打上去就可以啦，我这里就不弄了。变量比较多，咱们选出需要的变量，并且把字符变量转成因子。

10 条评论您还未登录，请先登录后发表或查看评论

R语言机器学习篇——逻辑回归2(多分类)

m0_73275932的博客

01-15

2939

处理多分类问题时，同样可采用逻辑回归进行分析

R语言 所有分类数据回归

08-30

#glmnet包含有线性回归，逻辑回归，泊松计数模型，cox回归模型，多分类逻辑回归多响应线性回归 #阿法系数=0是岭回归，阿法系数=1，是lasso回归 ############################################################ data(QuickStartExample) #20 Independent variables and 1 dependent variable fit<-glmnet(x,y) #查看计算路径 print(fit)#Df是非零系数的个数，第三列是惩罚力度，第二列是相应的惩罚力度对应的解释偏差百分比 #利用coef来提取模型的系数 coef(fit,s=0.1) #可视化 plot(fit) #预测 #参数newx用来设置输入数据，s用来设置朗姆塔（惩罚力度）的值 nx<-matrix(rnorm(10*20),10,20) predict(fit,newx=nx,s=c(0.1,0.05)) #交叉验证，筛选最优的朗姆塔的值，cv.glmnet函数实现这个功能 cvfit<-cv.glmnet(x,y) plot(cvfit)#红色散点为交叉验证的散点图，两条垂直的虚线为交叉验证后选定的朗姆塔 #提取最优的朗姆塔的值 cvfit$lambda.min#均方误差最小 cvfit$lambda.1se#一倍标准差 #根据朗姆塔来取得系数 coef(cvfit,s='lambda.min') #将稀疏矩阵转化为传统矩阵 as.matrix(coef(cvfit,s='lambda.min'))

基于sklearn的logistic回归对于鸢尾花的机器学习分类实践

12-22

在这个基于`sklearn`的Logistic回归对鸢尾花数据集的分类实践中，我们将探讨一些关键知识点。 1. **numpy的数组操作**： - `np.c_[]` 和 `np.r_[]` 是numpy中的拼接函数。`np.c_[]` 沿着列方向（axis=1）连接数组...

机器学习（三）---Logistic回归

向阳而生的博客

11-27

1131

线性模型与回归线性回归（linear regression）目的： – 学习一个线性模型以尽可能准确地预测实值输出标记：最小二乘与参数求解 Logistic 回归的本质是：假设数据服从这个分布，然后使用极大似然估计做参数的估计。极大似然估计，通俗理解来说，就是利用已知的样本结果信息，反推最具有可能（最大概率）导致这些样本结果出现的模型参数值！换句话说，极大似然估计提供了一种给定观察数据来评估模型参数的方法，即：“模型已定，参数未知”。对极大似然法还不是很了解的话可以看看下面..

r 多元有序logistic回归_R实现多分类logistic回归

weixin_39846898的博客

01-14

5746

多分类logistic回归在临床研究中，接触最多的是二分类数据，如淋巴癌是否转移，是否死亡，这些因变量最后都可以转换成二分类0与1的问题。然后建立二元logistic回归方程，可以得到影响因素的OR值。那么如果遇到多分类变量，如何进行logistic回归呢？譬如临床疗效分为好，中，差，三类，或者根据指标进行分类，分为高，中，低三类，我用１、２、３代表作为因变量，进行logistic回归分析。ima...

多分类逻辑回归_多分类逻辑回归_多分类_

10-01

多分类逻辑回归，使用R语言进行多分类逻辑回归，文件里是一个R语言导出的html文件，里面有代码以及案例分析。

多分类logistic回归模型ppt

11-26

logistics回归分析以及在医学方面的应用

R语言等级多分类Logistic回归模型实战

data+scenario+science+insight

09-22

6098

R语言有序多分类Logistic回归模型实战目录 R语言有序多分类Logistic回归模型实战： #导入包 #数据加载 #有序多分类Logistic回归模型 #导入包 #程序包MASS提供polr()函数可以进行ordered logit或probit回归 require(foreign) require(ggplot2) require(MASS) require(Hmisc) require(reshape2) #数据加载 dat <- read.dta("ol.

r语言逻辑回归_第四十七讲 R-多项逻辑回归／多类别逻辑回归

weixin_39535752的博客

11-20

2881

在第四十五投必得论文编译：第四十五讲 R-逻辑回归概论和四十六讲中第四十六讲 R-逻辑回归结果解读，我们为大家讲解了常见的逻辑回归，其结果变量（因变量）为二分类变量（是/否）但是在实际情况中，我们的结果变量不一定是二分类，它也可能是三分类，四分类，甚至更多类别，比如肿瘤的分期，疾病的分类等。这时，我们需要使用到经过改进的逻辑回归，即多项逻辑回归，又叫多类别逻辑回归（multinomial logi...

R语言 逻辑回归

KopWelkin的博客

04-25

2674

逻辑回归是回归模型，其中响应变量（因变量）具有诸如True / False或0/1的分类值。它实际上基于将其与预测变量相关的数学方程测量二元响应的概率作为响应变量的值。逻辑回归的一般数学方程为 - y = 1/(1+e^-(a+b1x1+b2x2+b3x3+...)) 以下是所使用的参数的描述 - y是响应变量。 x是预测变量。 a和b是作为数字常数的系数。用于创建回归模...

R语言多分类logistic逻辑回归模型在混合分布模拟个人风险损失值评估的应用

拓端研究室TRL

01-23

353

最近我们被客户要求撰写关于风险损失值评估的研究报告，包括一些图形和统计输出。通常，我们在回归模型中一直说的一句话是“请查看一下数据。

R语言构建无序多分类逻辑回归模型、mlogit.display函数获取无序多分类逻辑回归模型的汇总统计信息（各分组模型对应的系数及标准差、相对危险降低率RRR值及其置信区间、AIC值等）

statistics+insight+vista+power

07-04

631

R语言使用nnet包的multinom函数构建无序多分类logistic回归模型、使用epiDisplay包的mlogit.display函数获取无序多分类logistic回归模型的汇总统计信息（各分组模型对应的系数及标准差、相对危险降低率RRR值及其置信区间、AIC值等）.........

logistic回归_R语言实现logistic回归

weixin_39721953的博客

11-26

9305

引言：前面我们已经掌握了logistic回归的知识点，今天就来看看如何用R语言实现logistic回归。今天用到的数据来源于机器学习仓库，基于患者的一些信息以判定该患者是否患有心脏病(heart disease, hd)，链接如下：http://archive.ics.uci.edu/ml/datasets/Heart+Disease1. 数据读取###1读取UCI机器学习中的数据u...

r logistic回归多分类

09-09

logistic回归是一种广泛应用于二分类问题中的机器学习算法，但它也可以扩展到多分类问题。在多分类问题中，我们可以使用一对多（One-vs-All）方法来应用logistic回归。一对多方法是将多分类问题拆解为多个二分类问题。具体而言，我们首先选择一个类别作为正类别，将其余的所有类别作为负类别。然后，我们训练一个二分类的logistic回归模型来预测一个实例是否属于正类别。我们重复这个步骤，选择另一个类别作为正类别，直到覆盖了所有的类别。在预测阶段，我们将测试实例输入到每个训练好的logistic回归模型中，获得关于它属于每个类别的概率。然后，我们选择具有最高概率的类别作为预测结果。 logistic回归对于多分类问题有几个优点。首先，它计算简单，训练速度快。其次，它对于输入特征和输出之间的关系是具有可解释性的，可以帮助我们理解和解释预测结果。此外，logistic回归可以处理连续型和离散型的特征，适用于多种不同类型的数据。然而，logistic回归也有一些限制。例如，它假设了特征与输出之间的线性关系，并不能很好地处理复杂的非线性关系。此外，它对异常值和噪声比较敏感，需要对数据进行预处理和清洗。在实际应用中，logistic回归多分类可以用于许多问题，例如手写数字识别、情感分析、疾病诊断等。它是一个相对简单和有效的算法，可以作为多分类问题的基准算法之一。