![](https://img-blog.csdnimg.cn/20201014180756913.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
金融风控
「已注销」
这个作者很懒,什么都没留下…
展开
-
金融风控-贷款违约预测-task5 建模与调参
Mon 06Mon 13已完成 进行中 计划中 现有任务Adding GANTT diagram functionality to mermaid #mermaid-svg-yFTnZUchxY81c2Ie .label{font-family:'trebuchet ms', verdana, arial;font-family:var(--mermaid-font-family);fill:#333;color:#333}原创 2020-09-27 20:22:18 · 187 阅读 · 0 评论 -
金融风控-贷款违约预测-task4 建模与调参
文章目录1. 常见模型的对比与性能评估1.1 逻辑回归1.2 决策树模型1.3 集成模型集成方法(ensemble method)1.4 模型评估方法2. 建模3.调参 1. 常见模型的对比与性能评估 1.1 逻辑回归 优点 训练速度较快,分类的时候,计算量仅仅只和特征的数目相关; 简单易理解,模型的可解释性非常好,从特征的权重可以看到不同的特征对最后结果的影响; 适合二分类问题,不需要缩放输入特征; 内存资源占用小,只需要存储各个维度的特征值; 缺点 逻辑回归需要预先处理缺失值和异常值【可参考task3原创 2020-09-24 14:51:50 · 448 阅读 · 0 评论 -
金融风控-贷款违约预测-task3 特征工程
1. 特征工程概述 特征工程,是指用一系列工程化的方式从原始数据中筛选出更好的数据特征,以提升模型的训练效果。业内有一句广为流传的话是:数据和特征决定了机器学习的上限,而模型和算法是在逼近这个上限而已。由此可见,好的数据和特征是模型和算法发挥更大的作用的前提。特征工程通常包括数据预处理、特征选择、降维等环节。 2. 内容 首先导入相关包 import pandas as pd import numpy as np import matplotlib.pyplot as plt import seaborn原创 2020-09-21 13:22:34 · 1279 阅读 · 0 评论 -
金融风控-贷款违约预测-task2 数据分析
1. EDA概述 EDA (Exploratory Data Analysis),也就是对数据进行探索性的分析,从而为之后的数据预处理和特征工程提供必要的结论。 主要的步骤有: 理解问题; 读取数据; 数据预预处理(处理成易于分析的格式) 初步探索; 多变量探索; 数据预处理; 建立假设,并检验。 2. 目的 1.EDA的价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模。 2.了解变量间的相互关系、变量与预测值之间的存在关系。 3.原创 2020-09-18 10:56:55 · 259 阅读 · 0 评论 -
金融风控-贷款违约预测-task1 赛题理解
金融风控-贷款违约预测-task1 赛题理解 赛题来源: link 1. 赛题数据 赛题数据来自某信贷平台的贷款记录,总数据量超过120w,包含47列变量信息,其中15列为匿名变量。为了保证比赛的公平性,将会从中抽取80万条作为训练集,20万条作为测试集A,20万条作为测试集B,同时会对employmentTitle、purpose、postCode和title等信息进行脱敏。 Field Description id 为贷款清单分配的唯一信用证标识 loanAmnt 贷款金额 te原创 2020-09-14 09:59:19 · 457 阅读 · 0 评论