第六讲 逻辑回归与广义线性模型GLM开发实践
建模场景
二分类问题:逻辑回归
-
对数据进行二元分类:对病人进行疾病诊断
-
预测某件事情发生的概率:预测一个用户变成付费用户的概率
广义线性模型场景举例:
风险保费预测,根据需要提供的保障责任,计算预期总索赔额
两步建模:索赔次数*平均索赔金额
什么是广义线性回归模型(GLM)?
-
系统组件:线性预测器:n = β的转置 * x(可拟合)β是定义的未知参数
-
随机组件:一个指数族分布作为响应变量Y的概率分布p(Y;θ)
-
连接函数:
一阶优化器:SGD参数估计方法
二阶优化器(迭代重加权最小二乘法)优点:初始化准确,收敛速度快,缺点:计算/通信复杂度高
一阶+二阶叠加
秘密分享加法:
Alice,Bob,Charlie
-
Step1:秘密切分
-
Step2:分享切片与求和
-
Step3:结果构建
秘密分享乘法:分片,交互和计算,参与方得到分片,将结果进行相加得到秘密值
SSGLM参数解析:
选择回归
使用SSLR
1.准备SPU和数据(数据需要一体化)
2.模型训练
3.模型评估
使用SSGLM
模型训练:IRLS,SGD
优势:
可证安全
不依赖可信第三方
支持多种模型
计算高效