评分算法_评分卡基础—逻辑回归算法理解

369d2ef557497874c6b74e53615d1a39.png

风控业务背景

逻辑回归(Logistic Regression,LR)是建立信贷金融评分卡的重要模型,其具有形式简单、易于解释、鲁棒性强等优点。然而,很多建模同学并不是很清楚其原理。本文尝试对逻辑回归基础加以分析理解。

目录
Part 1. 从线性回归到逻辑回归
Part 2. 为什么采用sigmoid函数
Part 3. 利用极大似然估计法估计参数
Part 4. 最优化问题求解之梯度下降法
Part 5. 正则项的作用和种类
Part 6. 总结
致谢
版权声明
参考资料

符号定义

  • : 样本集,具有
    个样例
  • :标签集,具有
    个样例
  • : 第
    个样例的特征向量,具有
    维特征
  • :第
    个样例的类别标识,二分类问题
  • :样本集,维度为
  • :权重向量,与n维特征一一对应

Part 1. 从线性回归到逻辑回归

线性模型是指对各种属性进行线性加权组合的函数:

这一过程将信息进行整合;不同的权重(weight)反映了自变量对因变量不同的贡献程度 。

线性回归(Liner Regression)具有广泛应用,例如:预测房价、天气等等。

061fb9ce8bb7248edeadb8d085157b07.png
图 1 - 线性回归(Liner Regression)

但在实际应用中,很多人会忽略线性回归的几大假设:

  • 零均值假设:随机误差项均值为0。
  • 同方差假设:随机误差项方差相同。若满足这一特性,称模型具有同方差性
  • 无自相关假设:若不满足这一特性,称模型具有自相关性(Autocorrelation)。
  • ...

显然,线性回归的输出结果

。那如果要做分类呢?我们就考虑将线性回归的输出与分类任务的真实标签
联系起来,即再找一个映射函数。

我们采用一个

函数(也叫对数几率):

其函数图像如图2所示,直观感受其优美的姿态,对称、平滑,且输出

.

0b05bf7a8848b18bce6c0576429c6997.png
图 2 - sigmoid函数

我们尝试把

函数模块拼接到线性回归的输出后面,如图3所示。

116b0d3ed14b753aa623490755a515c5.png
图 3 - 线性回归与逻辑回归的关系

把图3用公式表达,也就是在

函数内嵌套一个线性回归:

我们再将其变换得到逻辑回归的另一种常见形式:

为什么要这样做呢?这是因为右边就是线性回归,而左边则引入了

(几率) 的概念,即
事件发生概率相对于不发生概率的比值。

显然可以得到正负样例的概率表达式:

Part 2. 为什么采用sigmoid函数

至此,你可能会有疑问:为什么这里就直接选择了

函数?

如果只是为了将输出结果从

映射到
  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值