Datawhale零基础入门金融风控——贷款违约预测（Task 4 建模与调参）

最新推荐文章于 2023-05-08 08:40:30 发布

嘟哔嘟哔嘟

最新推荐文章于 2023-05-08 08:40:30 发布

阅读量414

点赞数

文章标签：机器学习

本文链接：https://blog.csdn.net/qq_45933062/article/details/108762212

版权

Datawhale零基础入门金融风控——贷款违约预测（Task 4 建模与调参）

学习目标：

1、学习在金融分控领域常用的机器学习模型
2、学习机器学习模型的建模过程与调参流程
3、完成相应学习打卡任务

学习内容：

1、逻辑回归模型
2、树模型
3、集成模型
4、模型调参

学习记录：

导入包及相关设置：

import pandas as pd
import numpy as np
import warnings
import os
import seaborn as sns
import matplotlib.pyplot as plt
"""
sns 相关设置
@return:
"""
# 声明使用 Seaborn 样式
sns.set()
# 有五种seaborn的绘图风格，它们分别是：darkgrid, whitegrid, dark, white, ticks。默认的主题是darkgrid。
sns.set_style("whitegrid")
# 有四个预置的环境，按大小从小到大排列分别为：paper, notebook, talk, poster。其中，notebook是默认的。
sns.set_context('talk')
# 中文字体设置-黑体
plt.rcParams['font.sans-serif'] = ['SimHei']
# 解决保存图像是负号'-'显示为方块的问题
plt.rcParams['axes.unicode_minus'] = False
# 解决Seaborn中文显示问题并调整字体大小
sns.set(font='SimHei')

提示：这里统计学习计划的总量
例如：
1、技术笔记 2 遍
2、CSDN 技术博客 3 篇
3、学习的 vlog 视频 1 个

读取数据：

# reduce_mem_usage 函数通过调整数据类型，帮助我们减少数据在内存中占用的空间

def reduce_mem_usage(df):
    start_mem = df.memory_usage().sum() 
    print('Memory usage of dataframe is {:.2f} MB'.format(start_mem))
    
    for col in df.columns:
        col_type = df[col].dtype
        
        if col_type != object:
            c_min = df[col].min()
            c_max = df[col].max()
            if str(col_type)[:3] == 'int':
                if c_min > np.iinfo(np.int8).min and c_max < np.iinfo(np.int8).max:
                    df[col] = df[col].astype(np.int8)
                elif c_min > np.iinfo(np.int16).min and c_max < np.iinfo(np.int16).max:
                    df[col] = df[col].astype(np.int16)
                elif c_min > np.iinfo(np.int32).min and c_max < np.iinfo(np.int32).max:
                    df[col] = df[col].astype(np.int32)
                elif c_min > np.iinfo(np.int64).min and c_max < np.iinfo(np.int64).max:
                    df[col] = df[col].astype(np.int64)  
            else:
                if c_min > np.finfo(np.float16).min and c_max < np.finfo(np.float16).max:
                    df[col] = df[col].astype(np.float16)
                elif c_min > np.finfo(np.float32).min and c_max < np.finfo(np.float32).max:
                    df[col] = df[col].astype(np.float32)
                else:
                    df[col] = df[col].astype(np.float64)
        else:
            df[col] = df[col].astype('category')
    
    end_mem = df.memory_usage().sum() 
    print('Memory usage after optimization is: {:.2f} MB'.format(en

最低0.47元/天解锁文章

嘟哔嘟哔嘟

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Datawhale零基础入门金融风控——贷款违约预测（Task 4 建模与调参）

Datawhale零基础入门金融风控——贷款违约预测（Task 4 建模与调参）学习目标：1、学习在金融分控领域常用的机器学习模型2、学习机器学习模型的建模过程与调参流程3、完成相应学习打卡任务学习内容：1、逻辑回归模型2、树模型3、集成模型4、模型调参学习记录：导入包及相关设置：import pandas as pdimport numpy as npimport warningsimport osimport seaborn as snsimport matplot
复制链接

扫一扫