第 6 课：逻辑回归LR与广义线性模型GLM开发实践 —— 笔记

最新推荐文章于 2024-07-25 23:39:23 发布

Enoch0

最新推荐文章于 2024-07-25 23:39:23 发布

阅读量170

点赞数 10

分类专栏：隐语文章标签：逻辑回归笔记算法

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Cheers_/article/details/140100132

版权

隐语专栏收录该内容

6 篇文章 0 订阅

订阅专栏

一、背景知识-LR/GLM应用场景及原理

1. 广义线性模型建模场景举例

二分类问题：逻辑回归
1. 对数据进行二元分类：
  - 例如，对病人的数据进行疾病诊断。
2. 预测某件事情发生的概率：
  - 例如，预测一个网站用户变成付费用户的概率。
广义线性模型（GLM）
- 应用场景: 风险保费预测，根据要提供的保障责任，计算预期总索赔额

2. 广义线性模型

建模方法:
1. 直接对纯保费建模
  - 使用tweedie分布（1,2）
2. 通过两步建模间接近似
  - 纯保费 = 索赔次数 * 平均索赔金额
  - 索赔次数：泊松分布、负二项分布
  - 平均索赔金额：伽马分布、逆高斯分布
线性回归回顾:
- 它是GLM的一个基本形式，假设响应变量Y的真实值由两部分组成：系统组件和误差组件
- 线性回归: 响应变量Y的条件分布为高斯分布
- GLM扩展: 允许误差项的概率分布扩展为指数分布族，如伯努利分布（逻辑回归）、泊松分布、gamma分布、复合泊松Gamma分布、Tweedie分布等

3. 广义线性模型的三个关键组件

系统组件
随机组件
连接函数

二、隐语模型-密态SSLR/SSGLM

1. 广义线性模型参数估计

一阶优化器: SGD参数估计方法
二阶优化器: 迭代重加权最小二乘法（IRLS）
- 优点:
  - 初始化准确
  - 收敛速度快
- 缺点:
  - 计算/通信复杂度高

2. 秘密分享加法

Step1: 秘密切分
Step2: 分割交换与求和
Step3: 结果构建

3. 秘密分享乘法

三、应用实现-从理论到隐语应用

1. SSGLM参数解析

二阶优化器 + 一阶优化器

2. 使用SSLR

准备SPU和数据
- 数据需要归一化
模型训练
模型评估
- 模型训练（IRLS）
- 模型训练（SGD）

3. SS-LR / SSGLM 在隐语实现的独特优势

可证安全
不依赖可信第三方
支持多种模型:
- 伯努利分布（逻辑回归）
- 泊松分布
- gamma分布
- Tweedie分布
计算高效

四、实践

针对Tweedie分布的GLM建模

步骤:

准备数据: 数据需要预处理和归一化。
选择模型: 使用SSGLM选择Tweedie分布进行建模。
模型训练: 使用IRLS或SGD进行参数估计。
模型评估: 评估模型性能和准确性。

关注

10
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
第 6 课：逻辑回归LR与广义线性模型GLM开发实践 —— 笔记

二分类问题：逻辑回归广义线性模型（GLM）建模方法:线性回归回顾:步骤:
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。