使用随机逻辑回归进行特征筛选，并利用筛选后的特征建立逻辑回归模型

最新推荐文章于 2022-10-17 19:27:38 发布

Carolinedy

最新推荐文章于 2022-10-17 19:27:38 发布

阅读量1w

点赞数 3

分类专栏： Python 特征选择数据挖掘模型 Scikit_Learn 逻辑回归模型文章标签： Scikit_Learn 逻辑回归模型特征选择

本文链接：https://blog.csdn.net/Carolinedy/article/details/80691877

版权

本文介绍了如何使用Scikit_Learn库的RandomizedLogisticRegression进行特征筛选。该方法通过在训练数据上进行子采样并应用L1惩罚的逻辑回归模型，其中随机子集的系数已缩放。通过多次随机化，它为反复被选中的特征赋予高分，实现稳定性选择。最终，选取得分高的特征用于建立逻辑回归模型。

摘要由CSDN通过智能技术生成

from sklearn.linear_model import LogisticRegression as LR
from sklearn.linear_model import RandomizedLogisticRegression as RLR

rlr=RLR()  #建立随机逻辑回归模型，筛选变量
rlr.fit(x,y)  #训练模型
rlr.get_support()  #获取特征筛选结果

print（u'有效特征为：%s'%','.join(np.array(data.iloc[:,:8].columns)[rlr.get_support()])）
x=data[np.array(data.iloc[:,:8].columns)[rlr.get_support()]].as_matrix()  #筛选好特征

lr=LR()  #建立逻辑回归模型
lr.fit(x,y)  #用筛选后的特征数据来训练模型
print(u'逻辑回归模型训练结束')
print(u'模型的平均正确率为：%s'%lr.score(x,y))  #给出模型的平均正确率

Scikit_Learn API :

sklearn.linear_model  广义线性模型

sklearn.linear_model.LogisticRegression   Logistic 回归分类器

Methods：

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

Carolinedy

关注关注

3
点赞
踩
37

收藏

觉得还不错? 一键收藏
6
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

dataframe 筛选_python—变量筛选

weixin_39884100的博客

11-27

1030

撰文 Yotsunoha编辑袁老师这里我们使用logit回归和OLS(最小二乘回归)回归展示一下python的变量筛选过程。from scipy import statsfrom statsmodels.formula.api import olsfrom statsmodels.stats.anova import anova_lmfrom statsmodels.stats.m...

python回归模型变量筛选_多元线性回归变量筛选

weixin_39825322的博客

12-06

2780

目录##变量筛选方法预测与回归诊断其他统计量SAS中Weight和Freq的区别Refreence1. 变量筛选方法全回归模型 (None)向前发(Forward) -- 逐步引入法向后发(Backward) --逐步剔除法逐步筛选法 (Stepwise)最大Rsquare增量法(Maxr)最小Rsquare增量法(Minr)Rsquare选择法(Rsquare)修正Rsquare选择法(Adjr...

6 条评论您还未登录，请先登录后发表或查看评论

pythont检验筛选变量_利用python进行T检验

weixin_39992483的博客

11-29

527

引入所需的包from scipy import statsimport numpy as np注：ttest_1samp, ttest_ind, ttest_rel均进行双侧检验H0:μ=μ0H_0: μ=μ_0H1:μ≠μ0H_1: μ≠μ_0单样本T检验-ttest_1samp生成50行x2列的数据np.random.seed(7654567) # 保证每次运行都会得到相同结果# 均值为5，...

机器学习第17篇 - 特征变量筛选（1）

悟道西方

02-18

3604

高维数据包括的检测变量越来越多，如基因表达数据中检测到的基因数目、扩增子测序中的OTU数目等。在训练模型时通常需要先对数据去冗余，提取一些关键变量。这不只可以加速模型的构建还可以降低模型的...

python回归模型变量筛选_SPSS分析技术：回归模型的自变量筛选方法；

weixin_39849894的博客

12-06

2467

原标题：SPSS分析技术：回归模型的自变量筛选方法；欢迎关注天善智能微信公众号，我们是专注于商业智能BI，大数据，数据分析领域的垂直社区。对商业智能BI、大数据分析挖掘、机器学习，python，R等数据领域感兴趣的同学加微信：tstoutiao，邀请你进入头条数据爱好者交流群，数据爱好者们都在这儿。基础回顾上篇文章，我们以两个自变量的分析案例为例，介绍了如果使用SPSS进行多重线性分析，如果是新...

python回归模型变量筛选_随机逻辑回归random logistic regression-特征筛选

weixin_39630410的博客

12-06

1079

python金融风控评分卡模型和数据分析微专业课(博主亲自录制视频)：http://dwz.date/b9vv#author：231469242@qq.com#微信公众号：pythonEducationfrom sklearn.linear_model import LogisticRegression as LRfrom sklearn.linear_model import Randomize...

LR_coef.zip_lr.coef_\_python_python特征选择_特征选择_逻辑回归 coef

09-24

本主题主要关注使用逻辑回归模型进行特征选择，并通过Python编程实现特征的重要性排序。我们将深入探讨逻辑回归、Python中的实现方法以及如何解读和利用`coef_`属性来评估特征的重要性。 逻辑回归是一种广泛使用的...

运用随机森林、逻辑回归、svm处理葡萄酒品质数据（含报告）

09-02

在处理葡萄酒品质数据时，它会利用数据集中的多个特征（如酒精含量、糖分、酸度等）进行训练，每个决策树都是在随机选取的特征子集上构建的，这有助于减少过拟合的风险。最后，通过多数投票或平均值来确定最终的预测...

SVM模型应用（五）通过随机逻辑回归模型对X特征值进行筛选以提高SVM模型预测

elite666的专栏

04-10

2847

import numpy as np import pandas as pd from sklearn import svm from sklearn.linear_model import LogisticRegression my_matrix=np.loadtxt("D:/data/pima-indians-diabetes.txt",delimiter=",",skiprows=0) ...

[Python] 逻辑回归分析

memory专栏

06-10

2016

数据示例以某银行贷款拖欠率数据进行逻辑回归建模，数据示例如下： 逻辑回归分析步骤特征筛选：本例采用稳定性选择方法中的随机逻辑回归 建立模型：利用筛选后的特征建立逻辑回归模型 输出平均正确率实现代码 #-*- coding: utf-8 -*- #逻辑回归 自动建模 import pandas as pd #参数初始化 filename = '../data/ban...

机器学习——逻辑回归原理（python实现）

maggieyiyi的博客

03-29

4807

yong逻辑回归是一种用于有监督学习的分类任务的简单算法，虽然算法的名字为回归，但是逻辑回归常常用于分类。一、什么是逻辑回归 1.1逻辑回归定义 逻辑回归是一种学习某个事件发生概率的算法。利用这个概率，可以对事件进行二元分类。（也可以三种类别以上分类）。因为是概率，所以输出值范围是0-1。 1.2 小栗子~（例子）比如suo，下雪天我们要不要穿棉鞋出门捏~(￣▽￣)~*？如果有积雪，我们就穿棉鞋出门，如果雪化了，我们就传平时滴鞋子~！！！我们用代码模拟一下数据： X轴代表温度，Y轴代

逻辑回归python实现

qq_46457813的博客

03-16

3202

逻辑回归 Sigmod函数 g(z)=11+e−z g(z)=\frac{1}{1+e^{-z}} g(z)=1+e−z1 预测函数 hθ(x)=g(θTx) h_{\theta}(x)=g(\theta^{T}x) hθ(x)=g(θTx) 代价函数 KaTeX parse error: Undefined control sequence: \ at position 2: \̲ ̲cost(h_{\theta}… 如果标签为1,预测值越大则损失越小如果标签为0,预测值越小则损失越大分别

风控模型中特征重要度的两种筛选方法

weixin_45545159的博客

10-17

1461

风控模型中特征重要度的两种筛选方法

机器学习中的特征选择及其Python举例

zhangjy3738的博客

10-29

1336

1.关于特征选择 简单来说，特征选择就是在你使用机器学习算法之前，通过相关处理来选择与你的预测变量或者输出结果，最有用或最相关的那些特征。它是特征工程的一部分，在机器学习中，我们通常会面临非常多的特征变量，几十个甚至上百个。对于这些特征，一方面全部纳入机器学习算法中会导致计算机开销很大，影响训练效率，另一方面，部分特征并不与预测变量有太大相关，纳入算法中反而会降低模型的准确性，特别是在线性回归、逻...

python实现逻辑回归建模进行分类预测及特征分析

数据杂坛

05-27

1496

python实现数据读取、数据清洗、数据编码、数据划分，并实现逻辑回归建模分类预测及特征分析（完整代码+实现效果）。

python逻辑回归

tjfsuxyy的博客

06-25

3898

逻辑回归的概念 逻辑回归是大数据技术的机器学习一种方法，它借助对某个事件的历史数据结果进行分析，从而预测某个事件未来发生的概率，是一种概率型非线性回归。其中概率取值只有“是”和“否”两种可能，并分别记为“1”和“0”。它最初是研究导致某年流行疾病发生的原因并找到相关的影响因素，然后通过流行疾病相关的影响因素去预测某年发生该流行疾病的可能性，后来慢慢地应用于信贷风险控制。 ...

7、python多种方式进行成单回归预测

UP Lee博客

01-04

849

多种方案成单预测比较 1 背景和挖掘目标基于关键的业务指标进行成单预测，对影响成单的因子了解 2 分析步骤 01 基于关键特征数据底表的分组处理 02 关于机会、名片表的处理基于业务逻辑或者数据表现进行分组，查看 03 处理成单跨期导致的名片-成单的数据对应问题 04 观察各关键指标对结果的影响大小，并选择有显著影响的特征 05 利用均值原理计算成单 06 Seque...

RandomizedLogisticRegression ImportError解决思路参考

yijilei的博客

10-14

3075

ImportError: cannot import name ‘RandomizedLogisticRegression’ from ‘sklearn.linear_model’ (c:\program files (x86)\python37-32\lib\site-packages\sklearn\linear_model_init_.py) 导包报以上错误，解决思路以下：版本不兼容。s...

病灶四分类模型，利用LASSO算法进行特征筛选，用逻辑回归建立分类模型。得到训练集准确率以及测试集准确率，每一类别的概率值，混淆矩阵，ROC曲线，使用MATLAB实现