金融风控训练营 Task 1 学习笔记

这篇博客主要介绍了金融风控训练营中Task 1的学习内容,包括数据概况、混淆矩阵的概念以及分类算法的评估指标。作者详细解释了TP、FP、FN和TN,并指出在样本分布不均匀时准确率不再适用。讨论了异常检测、客户流失等场景中的数据分布不均衡问题,并提出在赛题中,合格的模型应能预测借贷方违约概率,以便决策贷款额度。
摘要由CSDN通过智能技术生成

一、学习知识点概要

了解数据概况

学习混淆矩阵概念

准备率、精确率、召回率、F1-Score、P-R曲线、ROC空间以及金融风控预测类常见的评估指标。

二、学习内容

分类算法:
何为分类:
分类(Categorization or Classification)是找出数据库中一组数据对象的共同特点并按照分类模式将其划分为不同的类,其目的是通过分类模型,将数据库中的数据项映射到某个给定的类别。
为何要分类:
当我们拿到一个数据集时,它往往是杂乱无章的,我们需要通过对数据进行分类,更好地提取数据的信息、利用同种类别的数据进行特征分析。
如何评价一个分类算法的好坏:
对于二分类问题,机器预测的和实际的还是会有所偏差,所以我们引入评估指标来评价分类器的优良。

四个观测值:
①TP(真实正例):模型预测结果是正例并且实际值也是正例(如预测一名用户违约,而真实中该患者确实违约)
②FP(错误正例):模型预测结果是正例然而实际值确是负例(如预测一名患者违约,而真实中该患者无违约)
③FN(错误负例):模型预测结果是负例然而实际值却是正例(如预测一名患者无违约,而真实中该患者却违约)
④TN(真实负例):模型预测结果是负例并且实际值也是负例(如预测一名患者无违约,而真实中该患者确实无违约)
(我们在建立模型进行预测时,总希望混淆矩阵中的TP、TN数量越大越好&#x

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值