1、目标
根据已知用户违约数据,预测用户是否违约。
2、逻辑回归模型知识准备
模型目标: 分类0-1, 得到指定属性归类为1有多大概率,归类为0 有多大概率。--用于分类。
适用: 经典二分类问题
二元逻辑回归:回归结果分类0-1两类;
多元逻辑回归:回归结果分类两类以上。
逻辑回归推导原理
(参考了各种资料后纯个人理解个人认为已经是很通俗的白话文,可能中间与官放的原理讲解会有些出入,此处经过了个人的理解翻译,主要帮助了解一下原理,需要真正了解所有推导过程以及数学公式,还是需要另外搜一下其他大神的讲解哦,菜鸟起步望多包涵,多指教):
①线性回归推导原理:
逻辑回归与线性回归有很多相似之处,线性回归——已知多个自变量矩阵X,通过寻求一组最优的参数矩阵θ,建立一个回归方程(模型),该模型直线将尽可能多的已知的点-相当于Y【Hθ(X)】值。
A). 理论完美线性模型经过多有所有y点>>>Hθ(X)=θ.T * X
(相当于多元方程组 y=ax0+bx1+cx2 ,abc组合就是θ参数组合-θ.T为矩阵转置,X0等变量就是一列一列的矩阵)
B). 实际是不可能画出完全拟合(相当于穿过的意思)所有已知的y值点,那么求出来的模型和时间y值必会有一个误差那么
实际y值 = 预测y值 +误差 =>y=Hθ(X)+损失值=>
C). 我们的目标是经过尽可能多的点,那么我们希望误差值就是越小越好,误差值用已知的x、y值替代,求误差极小值,
经过一系列的各种复杂的数据公式原理用似然以及求导等推导【普通最小二乘法】,
最后大神推断出θ矩阵值=