主要根据数据集来建立一个逻辑回归模型
数据集来源https://pan.baidu.com/s/1izJZerx0lfvQX6YRKYWv-g
主要问题是根据数据建立一个逻辑回归模型来预测贷款是否逾期。
下面是对其进行编写的代码:
主要分为五步:
1.数据分析
- 对缺失值进行处理
- 对包含中文数据进行映射
- 对两个时间的不确定进行删除
2.划分训练集和验证集,验证集比例为test_size
3. 分标签和 训练数据
4.模型训练与模型预测
5.模型评分
代码
import pickle
import pandas as pd #数据分析
from pandas import Series,DataFrame
from sklearn.model_selection import train_test_split
import time
from sklearn.linear_model import LogisticRegression
from datetime import datetime
from sklearn.metrics import f1_score
print("开始......")
t_start = time.time()
path = "E:/moxingxuexi/Task1/data.csv"
"""=====================================================================================================================
1 读取数据
"""
print("数据预处理")
data = pd.read_csv(path ,en