- 博客(5)
- 收藏
- 关注
原创 [Datamining][FinancialRiskControl] Task04: 建模与调参
逻辑回归模型: 理解逻辑回归模型; 逻辑回归模型的应用; 逻辑回归的优缺点; 树模型: 理解树模型; 树模型的应用; 树模型的优缺点; 集成模型 基于bagging思想的集成模型 随机森林模型 基于boosting思想的集成模型 XGBoost模型 LightGBM模型 CatBoost模型 模型对比与性能评估: 回归模型/树模型/集成模型; 模型评估方法; 模型评价结果; 模型调参:..
2020-09-24 22:52:00 110
原创 [Datamining][FinancialRiskControl] Task02:数据分析
赛题:零基础入门数据挖掘 - 零基础入门金融风控之贷款违约目的: 1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接下来的机器学习或者深度学习建模. 2.了解变量间的相互关系、变量与预测值之间的存在关系。 3.为特征工程做准备 2.1 学习目标学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值) 学习了解变量间的相互关系、变量与预测值之间的存在关系 完成相应学习打卡任务2.2 内容介绍数据总
2020-09-18 23:56:56 1073
原创 [Datamining][FinancialRiskControl] Task01:赛题理解
竞赛采用AUC作为评价指标。AUC(Area Under Curve)被定义为 ROC曲线 下与坐标轴围成的面积。分类算法常见的评估指标如下:1、混淆矩阵(Confuse Matrix)(1)若一个实例是正类,并且被预测为正类,即为真正类TP(True Positive ) (2)若一个实例是正类,但是被预测为负类,即为假负类FN(False Negative ) (3)若一个实例是负类,但是被预测为正类,即为假正类FP(False Positive ) (4)若一个实例是负类,并且被预测
2020-09-15 23:41:33 162
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人