00 Index
01 LR是什么?
02 LR在金融领域有哪些优势
03 LR的算法推导过程
04 LR的重要参数
05 LR与评分卡
06 总结一下
🙊 01 LR是什么?
LR全称是 Logistic Regression,中文名为逻辑回归模型。虽然名字里带有“回归”二字,但其实是属于分类模型,属于线性分类器。既然LR里有“回归”,那就说明了它和回归多少有些渊源了。我们知道线性回归模型的一般表达形式如下:
θθθθ
我们还可以用矩阵来表示上面这个方程:
θθθθθ其中
其中,θ_0被我们称为截距(intercept),其余的θ被称为系数(coefficient)。而我们知道,线性回归模型的输出值是连续型,如果要将其映射成0和1的二分类值的话,就需要引入 Link Function,也就是我们常说的 Sigmoid函数:
它是一个S型的曲线函数,当z趋向于正无穷,它趋向于1,而z趋向于负无穷,它趋向于0,所以它可以让预测结果都映射到0-1之间,有点像归一化。我们把线性回归的θ代入到Sigmoid函数中,可以得到逻辑回归的一般表现形式:
θ
如果我们对二元逻辑回归取odds(形似几率,),其实是可以得到线性回归的,不信?请看:
θθ
θθθ
θ
θ
θ
所以其实我们的核心工作就是求解z中的θ,让其可以拟合数据得到相对准确的预测结果。
🏆 02 LR在金融领域有哪些优势
这个问题其实一个很重要的优势就是可解释性,当然,还有好几点:
可以解释性好:LR模型概率输出可以转化为对应的二分类概率,具备良好的可解释性,这对于金融行业而言非常重要,可以帮助业务人员更好理解模型以及模型内部的逻辑。
算法简单快速:LR算法是一种简单快速的模型,数据量大的情况下可以一定程度上减轻计算压力,大大提高了模型计算效率。
适用范围广&#x