金融风控训练营-Task04学习笔记

这篇博客详细介绍了金融风控领域常用的模型,包括逻辑回归、决策树、GBDT、XGBoost和LightGBM。重点讨论了模型的核心思想、判定边界、代价函数以及集成方法,并探讨了模型的性能评估标准和优缺点。内容深入浅出,适合有一定数学基础的学习者。
摘要由CSDN通过智能技术生成


本学习笔记为阿里云天池龙珠计划金融风控训练营的学习内容,学习链接为:https://tianchi.aliyun.com/specials/activity/promotion/aicampfr

一、学习知识点概要

  • 模型原理
    • 逻辑回归模型
    • 决策树模型
    • GBDT模型
    • XGBoost模型
    • LightGBM模型
  • 模型对比与性能评估
    • 逻辑回归
    • 决策树模型
    • 集成模型集成方法
    • 模型评估方法
    • 模型评估标准

二、学习内容

1、模型原理

1.1 逻辑回归模型

1.1.1 核心思想

如果线性回归的结果输出是一个连续值,而值的范围是无法限定的,那我们有没有办法把这个结果值映射为可以帮助我们判断的结果呢。而如果输出结果是 (0,1) 的一个概率值,这个问题就很清楚了。sigmoid函数(如下):

sigmoid函数
如果把sigmoid函数图像画出来,是如下的样子:
sigmoid函数
从函数图上可以看出,函数y=g(z)在z=0的时候取值为1/2,而随着z逐渐变小,函数值趋于0,z逐渐变大的同时函数值逐渐趋于1,而这正是一个概率的范围。

所以定义线性回归的预测函数为Y=WTX,那么逻辑回归的输出Y= g(WTX),其中y=g(z)函数正是sigmoid函数(S形函数)。

1.1.2 判定边界

θTX =0是一个决策边界,当它大于0或小于0时,逻辑回归模型分别预测不同的分类结果

1.1.3 代价函数与梯度下降

逻辑回归的代价函数:
逻辑回归的代价函数
用迭代公式表示出来的最小化 J(θ ) 的梯度下降算法如下:

迭代

1.2 决策树模型

1.2.1 ID3算法
  • ID3算法的核心是在决策树各个结点上对应信息增益准则选择特征,递归地构建决策树。

  • 具体方法是:

    • 从根结点开始,对结点计算所有可能的特征的信息增益,选择信息增益最大的特征作为结点的特征,由该特征的不同取值建立子节点;
    • 再对子结点递归地调用以上方法,构建决策树;
    • 直到所有特征的信息增益均很小或没有特征可以选择为止,最后得到一个决策树。

    ID3相当于用极大似然法进行概率模型的选择。

1.2.2 决策树可视化

可视化需要用到关于Matplotlib的函数:

  • getNumLeafs:获取决策树叶子结点的数目
  • getTreeDepth:获取决策树的层数
  • plotNode:绘制结点
  • plotMidText:标注有向边属性值
  • plotTree:绘制决策树
  • createPlot:创建绘制面板

1.3 GBDT模型

GBDT模型是一个集成模型,是很多CART树的线性相加。

GBDT模型可以表示为以下形式,我们约定f­­­t­(x)表示第t轮的模型,ht(x)表示第t颗决策树,模型定义如下:
f(x)
提升树采用前向分步算法。第t步的模型由第t-1步的模型形成,可以写成:

f(x)

损失函数自然定义为这样的:

在这里插入图片描述

虽然整体思路都挺清晰的,但是怎么确定第t步该加上一颗什么样的树确是个大问题。针对这个问题, Freidman提出了用损失函数的负梯度来拟合本轮损失的近似值,进而拟合一个CART回归树。即每次需要拟合的是模型的负梯度。第t轮的第i个样本的损失函数的负梯度表示为:

在这里插入图片描述

在这里插入图片描述
利用(xi, rti) (i=1,2,…m),我们可以拟合一颗CART回归树,得到了第t颗回归树,其对应的叶节点区域Rtj, j=1,2,…,J。其中J为叶子节点的个数。

针对每一个叶子节点里的样本,我们求出使损失函数最小,也就是拟合叶子节点最好的的输出值ctj如下:
在这里插入图片描述
决策树拟合函数就得到了:
在这里插入图片描述

1.4 XGBoost模型

XGBoost 是由 k 个基模型组成的一个加法运算式:

y ^ i = ∑ t = 1 k f t ( x i ) \hat{y}_{i} = \sum_{t=1}^{k}f_t(x_i)

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值