逻辑回归模型建立

最新推荐文章于 2022-05-07 13:50:49 发布

致樾

最新推荐文章于 2022-05-07 13:50:49 发布

阅读量1k

点赞数 1

分类专栏：模型文章标签： python

本文链接：https://blog.csdn.net/qq_43674583/article/details/107190762

版权

模型专栏收录该内容

1 篇文章 0 订阅

订阅专栏

数据准备

导入工具包

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
%matplotlib inline
#加载数据
churn=pd.read_csv(‘w4_churn.csv’)
将数据集中的类别变量转化为数字型变量
churn=pd.get_dummies(churn)
####查看前5行数据
churn.head()
#数据整理，将churn_yes保留，将female保留,drop不需要的数据
churn.drop([‘Churn_No’,‘gender_Male’],axis=1,inplace=True)
#查看数据
churn.head()
#统一大小写
churn.columns=churn.columns.str.lower()
#修改字段名
churn=churn.rename(columns={‘churn_yes’:‘flag’})
#查看数据
churn.head()

模型建立评估

#基于模型的结果，对训练集与测试集中x的真实值预测对应的y
y_pred_train=lr.predict(x_train)
y_pred_test=lr.predict(x_test)
print(y_pred_train)
#搭建训练集混淆矩阵
import sklearn.metrics as metrics
metrics.confusion_matrix(y_train,y_pred_train)
#计算训练集准确率
metrics.accuracy_score(y_train,y_pred_train)
#搭建测试集混淆矩阵
metrics.confusion_matrix(y_test,y_pred_test)
#计算测试集准确率
metrics.accuracy_score(y_test,y_pred_test)

模型优化调整参数

#加载数据切分工具包
from sklearn.model_selection import train_test_split
#切分训练集和测试集
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.5,random_state=100)
#建模
from sklearn import linear_model
lr=linear_model.LogisticRegression()
lr.fit(x_train,y_train)
#基于模型的结果，对训练集与测试集中x的真实值预测对应的y
y_pred_train=lr.predict(x_train)
y_pred_test=lr.predict(x_test)
print(y_pred_train)

#优化模型评估计算准确率
#搭建测试集混淆矩阵
metrics.confusion_matrix(y_test,y_pred_test)
#计算测试集准确率
metrics.accuracy_score(y_test,y_pred_test)
#搭建训练集混淆矩阵
import sklearn.metrics as metrics
metrics.confusion_matrix(y_train,y_pred_train)
#计算训练集准确率
metrics.accuracy_score(y_train,y_pred_train)

模型优化调整变量

y=churn[‘flag’]
x=churn[[‘contract_month’,‘internet_other’,‘paymentelectronic’]]

#加载数据切分工具包
from sklearn.model_selection import train_test_split
#切分训练集和测试集
x_train,x_test,y_train,y_test=train_test_split(x,y,test_size=0.5,random_state=100)

#建模
from sklearn import linear_model
lr=linear_model.LogisticRegression()
lr.fit(x_train,y_train)

#基于模型的结果，对训练集与测试集中x的真实值预测对应的y
y_pred_train=lr.predict(x_train)
y_pred_test=lr.predict(x_test)
print(y_pred_train)

#优化模型评估计算准确率
#搭建测试集混淆矩阵
metrics.confusion_matrix(y_test,y_pred_test)
#计算测试集准确率
metrics.accuracy_score(y_test,y_pred_test)

#搭建训练集混淆矩阵
import sklearn.metrics as metrics
metrics.confusion_matrix(y_train,y_pred_train)
#计算训练集准确率
metrics.accuracy_score(y_train,y_pred_train)

致樾

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
逻辑回归模型建立

数据准备导入工具包import pandas as pdimport seaborn as snsimport matplotlib.pyplot as plt%matplotlib inline#加载数据churn=pd.read_csv(‘w4_churn.csv’)将数据集中的类别变量转化为数字型变量churn=pd.get_dummies(churn)####查看前5行数据churn.head()#数据整理，将churn_yes保留，将female保留,drop不需要的数据
复制链接

扫一扫