龙技术
一篇诗,一斗酒,一曲长歌,一剑天涯
展开
-
金融风控-不均衡学习和异常检测
06_不均衡学习和异常点检测学习目标知道样本不均衡时的常用处理方式掌握SMOTE过采样的使用知道LOF算法的原理知道IForest算法的原理应用异常检测算法进行数据清洗1 样本不均衡简介通常分类机器学习任务期望每种类别的样本是均衡的,即不同目标值样本的总量接近相同。在梯度下降过程中,不同类别的样本量有较大差异时,很难收敛到最优解。很多真实场景下,数据集往往是不平衡的,一些类别含有的数据要远远多于其他类的数据在风控场景下,负样本的占比要远远小于正样本的占比样本不均衡举例原创 2021-10-11 20:16:49 · 336 阅读 · 0 评论 -
金融风控-机器学习评分卡
五 评分卡模型构建学习目标掌握KS值的计算方法知道评分映射方法知道XGBoost和LightGBM基本原理掌握使用lightGBM进行特征筛选的方法应用toad构建评分卡模型1 模型构建流程1.1 实验设计新的模型能上线一定要比原有方案有提升,需要通过实验证明冷启动业务初期成长期波动期策略调整新增数据源人工审核人工审核新旧模型对比新旧模型对比避免迭代模型新旧模型对比规则模型标准模型长短表现期对比稳定和波动人群线上模型、陪跑和标原创 2021-10-11 20:14:47 · 717 阅读 · 0 评论 -
金融风控-特征评估与筛选
特征筛选学习目标掌握单特征分析的衡量指标知道 IV,PSI等指标含义知道多特征筛选的常用方法掌握Boruta,VIF,RFE,L1等特征筛选的使用方法1 单特征分析什么是好特征?从几个角度衡量:覆盖度,区分度,相关性,稳定性覆盖度采集类,授权类,第三方数据在使用前都会分析覆盖度采集类 :如APP list (Android 手机 90%)授权类:如爬虫数据(20% 30%覆盖度)GPS (有些产品要求必须授权)一般会在两个层面上计算覆盖度(覆盖度 = 有数据的用户原创 2021-10-11 20:10:46 · 326 阅读 · 0 评论 -
金融风控-特征构造
3 特征构造学习目标知道未来信息的概念,及处理未来信息的方法掌握从原始数据构造出新特征的方法掌握特征变换的方法掌握缺失值处理的方法1 数据准备1.1 梳理数据的内在逻辑关系种类一对一:一个用户有一个注册手机号一对多:一个用户多笔借款多对多:一个用户可以登录多个设备,一个设备可以有多个用户登录举例下图中,蓝色框为二月当期账单,红色框为订单[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-eG8LxzLu-1633954039582)(img/原创 2021-10-11 20:09:41 · 118 阅读 · 0 评论 -
金融风控-风控建模概述
风控建模概述学习目标知道信贷审批业务的基本流程知道ABC评分卡是什么,有什么区别知道风控建模的流程掌握评分卡模型正负样本定义方法知道如何构建特征,如何评估特征1 互联网金融风控体系介绍信贷审批业务基本流程四要素认证:银行卡持有人的姓名、身份证号、银行卡号、手机号互联网金融风控体系主要由三大部分组成:用户数据:用户基本信息、用户行为信息、用户授权信息、外部接入信息。数据采集会涉及到埋点和爬虫技术,基本上业内的数据都大同小异。免费的运营商数据安卓可爬的手机内部原创 2021-10-11 20:05:32 · 376 阅读 · 0 评论 -
金融风控-风控报表
1 信贷业务逻辑1.1 信贷业务如何运行市场部门/风控部门/催收部门市场部门→获客新客转化/存量激活地推电销平台广告(抖音, 微信, 微博……)营销短信风控部门→筛选用户是不是目标客群要不要放款给多少额度给多少利率给多少期资金回收(催收部门)催收精细化运营市场, 风控, 催收各个环节添加运营手段市场→ 不同获客方式 , 不同人群是否在后期表现都一致存量用户召回→利率优惠, 免息券风控→ 找到额度, 利率的最佳平衡点催收→ 不同的客原创 2021-10-11 20:03:37 · 268 阅读 · 0 评论 -
金融风控项目-# 相关业务介绍
金融风控相关业务介绍学习目标知道常见信贷风险知道机器学习风控模型的优势知道信贷领域常用术语含义1 信贷&风控介绍信贷业务,就是贷款业务,是商业银行和互联网金融公司最重要的资产业务和主要赢利手段通过放款收回本金和利息,扣除成本后获得利润。贷款平台预测有信贷需求用户的还款情况,然后将本金借贷给还款概率大的用户信贷业务中的风险控制:信贷业务中,使用信用来预支金钱,在小额贷业务中往往没有抵押物,那么贷款方就会承担一定风险(用户不还钱)风控就是对用户的信用风险进行管理与规避原创 2021-09-19 21:44:17 · 843 阅读 · 0 评论