python对逻辑回归进行显著性检验_python 数据分析基础 day19-使用statsmodels进行逻辑回归...

本文是《Python数据分析基础》的第19天读书笔记,介绍了如何使用statsmodels库进行逻辑回归。首先,通过数据清洗、特征处理,然后训练逻辑回归模型,并在测试集上进行预测。通过模型的summary2()方法,可以对模型的系数进行显著性检验。
摘要由CSDN通过智能技术生成

今天是读《python数据分析基础》的第19天,读书笔记内容为使用statsmodels进行逻辑回归。

以下代码将按数据清洗、训练模型、得出测试集的预测值这三个步骤展示

逻辑回归模型的使用。

#使用逻辑回归预测客户流失概率

import pandas as pd

import numpy as np

import statsmodels.api as sma

#导入数据

inputCsv='数据路径'

churn=pd.read_csv(inputCsv)

#数据预处理

#将列标题的空格替换为下划线,将引号和问号去除,标题字母变为小写

churn.columns=churn.columns.str.replace(' ','_').str.replace('\'','').str.strip('?').str.lower()

#将churn字段值中'.'删除,

churn.churn=churn.churn.str.strip('.')

#print(churn.head(5))

#新增一个字段,将churn字段转换为01编码字段

churn['churn01']=np.where(churn.churn=='True',1,0)

#对字段intl_plan及vmail_plan进行独热编码(新增虚拟变量)

intl_plan_dummy=pd.get_dummies(churn.intl_plan,prefix='intl_plan')

  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值