项目分析
文章平均质量分 82
莽撞少年
热烈且自由
展开
-
评分卡模型构建(含泪总结精华!!)
五 评分卡模型构建学习目标 掌握KS值的计算方法 知道评分映射方法 知道XGBoost和LightGBM基本原理 掌握使用lightGBM进行特征筛选的方法 应用toad构建评分卡模型 1 模型构建流程1.1 实验设计 新的模型能上线一定要比原有方案有提升,需要通过实验证明 冷启动 业务初期 成长期 波动期 策略调整 新增数据源 人工审核 人工审核 新旧模型对比 新旧模型原创 2021-09-24 11:07:49 · 4961 阅读 · 0 评论 -
阿里云如何提供接口 生成api?
1 阿里云生成api 生成接口原创 2022-06-30 12:08:47 · 1359 阅读 · 0 评论 -
ODS
OLTP数据结构(重要)关系图订单模块订单表:订单核心信息订单详情表:订单表的副表,id和订单表一致订单分组表:订单组-壳子订单退款表:订单退款详情订单配送表:订单配送详情订单评价表:订单评价信息订单商品评价表:订单商品评价信息订单结算表:各方的收益结算订单商品快照表:下单后定型的商品信息,和SKU脱离支付模块订单组支付表:订单组支付成功以后插入数据。交易记录表:交易的详细记录信息。店铺商圈模块店铺表商圈...原创 2021-10-24 21:32:40 · 2730 阅读 · 0 评论 -
数仓工具!! 项目要用
数仓工具(重点)练习:http://hadoop02:8889/账号:hue密码:hueHue操作HDFS(操作)新建文件夹、新建文件、上传文件、查看文件、编辑文件、删除文件。Hue操作Hive(重点)建库、建表、插入、查询内置函数: 精度四舍五入 ▁▁▁round(double, length)字符串截取函数 ▁▁▁substr(string, start, length)字符串拼接函数 ▁▁▁concat concat_ws年月日获取▁▁▁year/quart原创 2021-10-21 21:02:35 · 400 阅读 · 0 评论 -
零售项目: 第一天总结
新零售项目项目背景介绍、业务需求、虚拟机环境准备;零售行业的发展历程 地摊、货郎 价格老板自己说了算 不稳定,流动性大 质量没有保障 种类少 百货商店 门店货物多 明码标价 随进随出 质量有所保证 超级市场 自选商品 购物效率 环境更好 商品的包装等,竞争更激烈,质量也更高原创 2021-10-21 20:04:19 · 207 阅读 · 0 评论 -
金融分析项目分析 !!!
day07问题小结掌握风控报表中指标计算方法知道ABC评分卡是什么,有什么区别掌握评分卡模型正负样本定义方法5 风控建模概述【续day07】5.2 风控建模流程2.1 评分卡简介风控模型其中包含了A/B/C卡。模型可以采用相同算法,一般以逾期天数来区分正负样本,也就是目标值Y的取值(0或1) 贷前 申请评分卡 Application score card 贷中 行为评分卡 Behavior score card 贷后 催收评分卡 Collection s原创 2021-09-25 14:05:01 · 683 阅读 · 0 评论 -
金融风控项目完分析!!!
day06问题小结对于历史逾期天数和当前逾期天数有些模糊 比如有一笔欠款9.10日要还,但是9.12号才还完,这个就是历史逾期了2天, 再比如还是9.10日要还,到今天都还没还,这个就是当前逾期天数10天。 多说一下场景下为什么要这么处理,处理的结果表示什么意思掌握如何设计AB测试掌握AB测试效果解读方法知道常见信贷产品1 信贷业务逻辑1.1 信贷业务如何运行市场部门/风控部门/催收部门市场部门→获客风控部门→筛选用户资金回收(催收部门)精原创 2021-09-25 14:03:40 · 1066 阅读 · 0 评论 -
不均衡学习和异常检测
06_不均衡学习和异常点检测学习目标 知道样本不均衡时的常用处理方式 掌握SMOTE过采样的使用 知道LOF算法的原理 知道IForest算法的原理 应用异常检测算法进行数据清洗 1 样本不均衡简介 通常分类机器学习任务期望每种类别的样本是均衡的,即不同目标值样本的总量接近相同。 在梯度下降过程中,不同类别的样本量有较大差异时,很难收敛到最优解。 很多真实场景下,数据集往往是不平衡的,一些类别含有的数据要远远多于其他类的数原创 2021-09-25 14:01:15 · 1180 阅读 · 1 评论 -
特征构造预筛选
特征筛选学习目标 掌握单特征分析的衡量指标 知道 IV,PSI等指标含义 知道多特征筛选的常用方法 掌握Boruta,VIF,RFE,L1等特征筛选的使用方法 1 单特征分析 什么是好特征?从几个角度衡量:覆盖度,区分度,相关性,稳定性 覆盖度 采集类,授权类,第三方数据在使用前都会分析覆盖度 采集类 :如APP list (Android 手机 90%) 授权类:如爬虫数据(20% 30原创 2021-09-24 10:48:53 · 361 阅读 · 0 评论 -
金融风控 特征构造(有点多!!!)
3 特征构造学习目标 知道未来信息的概念,及处理未来信息的方法 掌握从原始数据构造出新特征的方法 掌握特征变换的方法 掌握缺失值处理的方法 1 数据准备1.1 梳理数据的内在逻辑关系种类一对一:一个用户有一个注册手机号一对多:一个用户多笔借款多对多:一个用户可以登录多个设备,一个设备可以有多个用户登录 举例 下图中,蓝色框为二月当期账单,红色框为订单 梳理类ER图 任务:分析厚数据常登陆首单用户的逾期情况原创 2021-09-23 20:13:06 · 521 阅读 · 0 评论 -
数据分析项目分析之风控建模!!
风控建模概述学习目标 知道信贷审批业务的基本流程 知道ABC评分卡是什么,有什么区别 知道风控建模的流程 掌握评分卡模型正负样本定义方法 知道如何构建特征,如何评估特征 1 互联网金融风控体系介绍 信贷审批业务基本流程 四要素认证:银行卡持有人的姓名、身份证号、银行卡号、手机号 互联网金融风控体系主要由三大部分组成: 用户数据:用户基本信息、用户行为信息、用户授权信息、外部接入信息.原创 2021-09-22 18:28:03 · 1388 阅读 · 0 评论 -
金融风控项目2 ---很细节(数据分析)
金融风控相关业务介绍学习目标 知道常见信贷风险 知道机器学习风控模型的优势 知道信贷领域常用术语含义 1 信贷&风控介绍 信贷业务,就是贷款业务,是商业银行和互联网金融公司最重要的资产业务和主要赢利手段 通过放款收回本金和利息,扣除成本后获得利润。 贷款平台预测有信贷需求用户的还款情况,然后将本金借贷给还款概率大的用户 信贷业务中的风险控制: 信贷业务中,使用信用来预支金钱,在小额贷业务中往往没有抵押物,那么原创 2021-09-20 11:39:07 · 816 阅读 · 1 评论 -
金融风控项目(数据分析最后阶段精华总结很久!)
1 信贷业务逻辑1.1 信贷业务如何运行 市场部门/风控部门/催收部门 市场部门→获客 新客转化/存量激活 地推 电销 平台广告(抖音, 微信, 微博……) 营销短信 风控部门→筛选用户 是不是目标客群 要不要放款 给多少额度 给多少利率 给多少期 资金回收(催收部门) 催收原创 2021-09-19 17:52:50 · 2027 阅读 · 1 评论