分级加权评分算法 java_荐书|智能风控:原理、算法与工程实践

22d86adca5e4a6f2b5aba6a592a1bc1d.png

图书简介

风控领域是新兴的机器学习应用场景之一,其特点包括了负样本占比极少、业务对模型解释性要求偏高、业务模型多样、风控数据源丰富等。

《智能风控:原理、算法与工程实践》一书共 8 章,包含 26 种解决方案,分别介绍了自动化规则挖掘、集成模型评分卡、项目冷启动、幸存者偏差、不均衡学习、异常检测、模型优化、网络挖掘等方向所面临的问题,同时利用决策树、集成学习、迁移学习、无监督学习、半监督学习、模型融合、深度学习、图算法等机器学习模型对其进行改善,帮助读者更好、更快地解决实际的建模问题。本书由机械工业出版社于2019年12月出版。

作者简介

梅子行,男,历任多家金融科技公司风控算法研究员、数据挖掘工程师等职位。现供职于智能物流独角兽公司——满帮科技。

师承Experian、Discover等风控专家。擅长深度学习、复杂网络、迁移学习、异常检测等非传统机器学习方法。热衷于数据挖掘以及算法的跨领域优化实践。

图书目录

前言

第 1 章 风控建模与规则挖掘 / 1

1.1 信贷与风险 / 1

1.1.1 信贷业务与互联网金融风控体系 / 1

1.1.2 信贷风险与控制 / 4

1.2 工业建模流程 / 5

1.2.1 抽象业务 / 6

1.2.2 定义标签 / 6

1.2.3 样本选取 / 7

1.2.4 特征工程与模型调优 / 7

1.2.5 上线监控与评估报表 / 8

1.3 规则挖掘方案 / 11

1.4 本章小结 / 18

第 2 章 集成模型评分卡 / 19

2.1 特征工程解析 / 19

2.1.1 特征与模型 / 20

2.1.2 信用模型的特征 / 20

2.2 特征衍生方案 / 22

2.3 离散处理 / 24

2.3.1 one-hot编码 / 25

2.3.2 WOE编码 / 26

2.4 迭代特征筛选方案 / 31

2.5 自动化调参 / 36

2.5.1 自动化调参策略 / 37

2.5.2 参数搜索方案 / 37

2.5.3 调参框架搭建 / 38

2.6 递归特征删除方案 / 41

2.7 评分卡制作 / 43

2.7.1 逻辑回归评分卡 / 43

2.7.2 集成模型的评分映射 / 53

2.8 本章小结 / 58

第 3 章 迁移学习与冷启动 / 59

3.1 迁移学习基础 / 59

3.1.1 应用场景 / 60

3.1.2 概念介绍 / 60

3.2 迁移学习方法论 / 61

3.2.1 三类常见算法 / 61

3.2.2 迁移的实现方法 / 62

3.3 少量有标签样本的迁移方案 / 63

3.3.1 TrAdaBoost模型 / 63

3.3.2 跨场景迁移模型 / 65

3.4 无标签样本迁移之 JDA / 74

3.4.1 JDA模型 / 74

3.4.2 模型应用 / 77

3.5 无标签样本迁移之 DTELM / 80

3.5.1 ELM模型 / 80

3.5.2 DTELM模型 / 81

3.5.3 模型应用 / 83

3.6 迁移样本筛选方案 / 88

3.6.1 背景介绍 / 88

3.6.2 算法框架概览 / 88

3.6.3 搭建融合框架 / 88

3.7 本章小结 / 93

第 4 章 幸存者偏差 / 94

4.1 幸存者偏差的含义 / 94

4.2 增量学习 / 95

4.3 生成对抗网络 / 96

4.3.1 GAN模型介绍 / 97

4.3.2 GAN与幸存者偏差 / 98

4.4 高斯聚类模型 / 99

4.4.1 GMM算法原理 / 99

4.4.2 GMM简单应用 / 102

4.4.3 GMM中的概率模型 / 102

4.4.4 GMM样本生成 / 106

4.5 信息准则 / 108

4.5.1 赤池信息准则 / 109

4.5.2 贝叶斯信息准则 / 109

4.5.3 AIC与BIC比较 / 110

4.6 本章小结 / 111

第 5 章 不均衡学习 / 112

5.1 样本不均衡 / 112

5.2 代价敏感加权方案 / 113

5.3 插值过采样方案 / 114

5.3.1 SMOTE算法 / 114

5.3.2 过采样算法实践 / 115

5.4 半监督学习方案 / 120

5.4.1 前提假设 / 121

5.4.2 S3VM / 121

5.4.3 LP / 125

5.5 本章小结 / 129

第 6 章 异常检测 / 130

6.1 离群点与欺诈检测 / 130

6.2 z-score检验 / 131

6.3 LOF异常检测法 / 132

6.3.1 原理与算法流程 / 132

6.3.2 LOF样本清洗方案 / 134

6.4 IF异常检测法 / 137

6.4.1 原理与算法流程 / 137

6.4.2 PreA模型与冷启动 / 139

6.5 本章小结 / 141

第 7 章 模型优化 / 142

7.1 多损失函数分段预测 / 142

7.1.1 2种损失函数 / 143

7.1.2 融合流程 / 143

7.2 树模型特征衍生 / 145

7.2.1 GBDT离散化 / 146

7.2.2 融合方案详解 / 146

7.2.3 特征衍生细节 / 147

7.2.4 案例 / 148

7.3 时间序列建模 / 156

7.3.1 RNN / 157

7.3.2 LSTM / 160

7.3.3 门控结构 / 161

7.3.4 LSTM行为评分卡案例 / 163

7.4 高维稀疏数据建模 / 167

7.4.1 算法原理 / 167

7.4.2 算法应用 / 169

7.5 模型融合 / 171

7.5.1 模型融合基础 / 171

7.5.2 模型筛选 / 172

7.6 本章小结 / 179

第 8 章 知识图谱 / 180

8.1 复杂网络基础 / 180

8.2 中心度与相似性 / 183

8.3 节点分类 / 189

8.3.1 朴素节点分类 / 189

8.3.2 邻节点加权投票 / 191

8.3.3 一致性标签传播 / 193

8.4 社区发现算法 / 196

8.4.1 基础概念 / 196

8.4.2 Girvan-Newman算法 / 197

8.4.3 Louvain算法 / 199

8.4.4 社区评估 / 200

8.5 网络表示学习 / 202

8.5.1 矩阵分解 / 203

8.5.2 节点嵌入 / 207

8.6 图卷积神经网络 / 211

8.6.1 卷积神经网络 / 211

8.6.2 傅里叶变换 / 213

8.6.3 拉普拉斯算子 / 215

8.6.4 GCN中的图卷积 / 217

8.6 本章小结 / 221

参考文献 / 222

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 拍贷“魔镜风控系统”从平均 400 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 个数据维度评估用户当前的信状态,给每借款 人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前 状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个人打出当前状态的 信用分,在此基础上再结合新发标息对于每个6个月内逾 个月内逾 期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来期率的预测 ,为投资人提供关键决策依据。本次竞赛目标是根用户历史行数来用户在未来 用户在未来 用户在未来 6个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 个月内是否会逾期还款的概率。 问题转换成 问题转换成 问题转换成 2分类问题,评估指标为 分类问题,评估指标为 分类问题,评估指标为 分类问题,评估指标为 分类问题,评估指标为 分类问题,评估指标为 分类问题,评估指标为 AUC ,从 Master Master Master,LogInfoLogInfo LogInfo ,UpdateInfo UpdateInfo UpdateInfo 表中构建 表中构建 特征,考虑评估指标为 特征,考虑评估指标为 特征,考虑评估指标为 特征,考虑评估指标为 特征,考虑评估指标为 AUC AUC,其本质是排序优化问题,所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 ,其本质是排序优化问题所以我们在模型顶层融合也使用基于 排序优化的 排序优化的 排序优化的 RANK_AVG RANK_AVG RANK_AVG融合方法。 融合方法。 融
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值