使用逻辑回归预测还款拖欠情况

最新推荐文章于 2024-09-14 20:30:05 发布

01_6

最新推荐文章于 2024-09-14 20:30:05 发布

阅读量310

点赞数 13

分类专栏：机器学习文章标签：逻辑回归算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/2301_77444219/article/details/140052328

版权

机器学习专栏收录该内容

24 篇文章 0 订阅

订阅专栏

目录

3.交叉验证选择较优惩罚因子

4.训练和预测

本代码将实现对名为data.xls的数据集进行逻辑回归预测，列名分别为年龄教育水平当前工作年限当前居住年限家庭收入债务占收入比例信用卡负债其他负债还款拖欠情况，以还款拖欠情况为标签，并在训练前对数据进行标准化。

1.导入库

import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score
import numpy as np

2.数据处理

#  读取数据
df = pd.read_excel('data.xls')

#  数据预处理
X = df.iloc[:, :-1]  # 特征列
y = df.iloc[:, -1]   # 标签列

# 对特征进行标准化
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

#  分割数据集
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=42)

3.交叉验证选择较优惩罚因子

scores = []
c_param_range = [0.01, 0.1, 1, 10, 100]
for i in c_param_range:  
    lr = LogisticRegression(C = i, penalty = 'l2', solver = 'lbfgs', max_iter = 1000)
    score = cross_val_score(lr, X_train, y_train, cv = 10, scoring = 'recall')  # 交叉验证
    score_mean = sum(score) / len(score)  
    scores.append(score_mean) 
    print(score_mean)   # 将不同的c参数分别传入模型，分别看看哪个模型效果更好

##
best_c = c_param_range[np.argmax(scores)]  #寻找到scores中最大值的对应的序号所对应的参数
print("最优惩罚因子为: {}".format(best_c))

4.训练和预测

#  训练模型
model = LogisticRegression(C = best_c, penalty = 'l2', max_iter = 1000)
model.fit(X_train, y_train)

#  模型预测
y_pred = model.predict(X_test)

5.评估模型

accuracy = accuracy_score(y_test, y_pred)
print(f'模型准确率: {accuracy * 100:.2f}%')

关注

13
点赞
踩
5

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。