![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Datawhale
当下有大吉8
这个作者很懒,什么都没留下…
展开
-
零基础入门数据挖掘 - 贷款违约预测笔记(5)
前言本篇是跟着Datawhale学习数据挖掘的第五篇笔记,记录模型融合的多种方式。内容平均:简单平均法:结果直接融合 求多个预测结果的平均值。pre1-pren分别是n组模型预测出来的结果,将其进行加权融合。pre = (pre1 + pre2 + pre3 +...+pren )/n加权平均法:一般根据之前预测模型的准确率,进行加权融合,将准确性高的模型赋予更高的权重。pre = 0.3pre1 + 0.3pre2 + 0.4pre3 投票:简单投票法from原创 2020-09-27 20:44:08 · 123 阅读 · 0 评论 -
零基础入门数据挖掘 - 贷款违约预测笔记(4)
前言本篇笔记主要是记录如何建模与调参,了解在金融风控领域中常用的机器学习模型,学习机器学习模型的建模过程与调参流程。内容逻辑回归模型逻辑回归:它将数据拟合到一个logit函数(或者叫做logistic函数)中,从而能够完成对事件发生的概率进行预测。逻辑回归模型常用于解决分类问题。逻辑回归模型的优点:(1)训练速度较快,分类的时候,计算量仅仅只和特征的数目相关;(2)简单易理解,模型的可解释性非常好,从特征的权重可以看到不同的特征对最后结果的影响;(3)适合二分类问题,不需要缩放输原创 2020-09-24 23:06:06 · 239 阅读 · 0 评论 -
零基础入门数据挖掘 - 贷款违约预测笔记(3)
前言本篇是入门数据挖掘的第三篇日记,主要记录学习特征工程的各个知识点。什么是特征工程?特征工程:其本质是一项工程活动,目的是最大限度地从原始数据中提取特征以供算法和模型使用,就是获取更好的训练数据,使机器学习算法达到最优。数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。内容1. 特征预处理缺失值填充#把所有缺失值替换为指定的值0data_train = data_train.fillna(0)#横向用缺失值上面的值替换缺失值data_train = data_原创 2020-09-21 21:56:20 · 160 阅读 · 0 评论 -
零基础入门数据挖掘 - 贷款违约预测笔记(2)
前言本篇是关于数据挖掘之数据探索分析(EDA)的学习笔记。什么是EDA?EDA是指对已有的数据(特别是调查或观察得来的原始数据)在尽量少的先验假定下进行探索,通过作图、制表、方程拟合、计算特征量等手段探索数据的结构和规律的一种数据分析方法。EDA的价值EDA的价值主要在于熟悉数据集,了解数据集,对数据集进行验证来确定所获得数据集可以用于接下来的机器学习或者深度学习使用。了解变量间的相互关系以及变量与预测值之间的存在关系引导数据科学从业者进行数据处理以及特征工程的步骤,使数据集的结构和原创 2020-09-18 22:27:06 · 149 阅读 · 0 评论 -
零基础入门数据挖掘 - 贷款违约预测笔记(1)
前言作为一名刚开始学习数据挖掘的零基础小白,有幸加入Datawhale学习群,并通过参与贷款违约预测的比赛,做到理论与实践并蓄。本篇是有关贷款违约预测比赛的第一篇学习笔记。背景贷款违约预测是一道以金融风控中的个人信贷为背景的赛题,要求根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。分类算法常见的评估指标如下:1、混淆矩阵(Confuse Matrix)(1)若一个实例是正类,并且被预测为正类,即为真正类TP(True Positive )(2)原创 2020-09-15 23:27:48 · 289 阅读 · 0 评论