- 博客(6)
- 收藏
- 关注
原创 金融风控训练营基础知识TASK06
知识回顾:前14天时间里,通过5个Task的学习,对金融风控的内容进行深入了解,金融风控评估的主体内容可以概括为数据分析、特征工程、建模和调参以及模型融合。如何在一份凌乱的数据中得到你想要的或者建立你认为可以概括事件的模型是这次比赛的重要目标。其中我们利用到了python语言帮助我们解决人力无法解决的问题。建模前,你就要对所有可能刻画出来的模型确定一个标准和指标,这次竞赛就使用了AUC。(简单回顾AUC:被定义为 ROC曲线 下与坐标轴围成的面积,显然这个面积的数值不会大于1。又由于ROC曲线.
2021-05-05 16:53:12
67
原创 金融风控训练营基础知识学习笔记task05
学习目标:将之前建模调参的结果进行模型融合学习内容:平均: 简单平均法 加权平均法 投票: 简单投票法 加权投票法 综合: 排序融合 log融合 stacking: 构建多层模型,并利用预测结果再拟合预测。 blending: 选取部分数据预测训练得到预测结果作为新特征,带入剩下的数据中预测。 学习笔记:stacking\blending详解tacking 将若干基学习器获得的预测结果,简单来说就是将数据带入N个学习器中得到预测结果,再把
2021-05-02 21:41:01
71
原创 金融风控训练营基础知识学习笔记task04
学习目标:学习在金融分控领域常用的机器学习模型 学习机器学习模型的建模过程与调参流程学习内容: 逻辑回归模型: 理解逻辑回归模型; 逻辑回归模型的应用; 逻辑回归的优缺点; 树模型: 理解树模型; 树模型的应用; 树模型的优缺点; 集成模型 基于bagging思想的集成模型 随机森林模型 基于boosting思想的集成模型 XGBoost模型 LightGBM模型 CatBoost模型 模型对比与性能
2021-04-30 12:43:32
65
原创 金融风控训练营基础知识学习笔记task02
学习目标:学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值) 学习了解变量间的相互关系、变量与预测值之间的存在关系 完成相应学习打卡任务学习内容:数据总体了解: 读取数据集并了解数据集大小,原始特征维度; 通过info熟悉数据类型; 粗略查看数据集中各特征基本统计量; 缺失值和唯一值: 查看数据缺失值情况 查看唯一值特征情况 深入数据-查看数据类型 类别型数据 数值型数据 离散数值型数据 连续数值型数据 数.
2021-04-27 16:30:05
78
原创 金融风控训练营基础知识学习笔记task03
学习目标:学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法 学习特征交互、编码、选择的相应方法学习内容:数据预处理 缺失值的填充 时间格式处理 对象类型特征转换到数值 异常值处理 基于3segama原则 基于箱型图 数据分箱 固定宽度分箱 分位数分箱 离散数值型数据分箱 连续数值型数据分箱 卡方分箱(选做作业) 特征交互 特征和特征之间组合 特征和特征之间衍生 其他特征衍生的尝试(选做作业) 特征编码 one
2021-04-27 16:27:01
94
原创 金融风控训练营金融风控基础知识学习笔记
一、赛题理解和学习目标:本次挑战赛以个人信贷为背景,要求选手对金融风控之贷款是否违约进行预测,以此判断是否通过此项贷款的一项问题型比赛。通过学习Task1了解第一个学习内容,要求对金融风控的问题建立数学模型最后给定金融风险程度。在此过程中要了解混淆矩阵、AUC评价指标,KS统计量等二、学习内容:混淆矩阵就是一个2×2的矩阵分为真正类TP、真分类TN、假正类FT、假反类FNFP FN TP TN AUC被定义在ROC曲线下与坐标轴围成的面积(ROC曲线:以真阳性率.
2021-04-22 15:01:15
185
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人