学习笔记:
**主题:广义线性模型(GLM)及其在隐私保护机器学习中的应用**
**1. 背景知识 - GLM应用场景及原理**
- **建模场景举例:**
- 二分类问题:如疾病诊断、预测用户付费概率。
- 风险保费预测:通过Tweedie分布、泊松分布等对保险数据建模。
- **GLM定义:**
- GLM扩展了线性回归的误差项分布,包括伯努利分布(逻辑回归)、泊松分布、Gamma分布等。
- 关键组件:线性预测器(系统组件)和误差组件(白噪声)。
**2. 隐语模型 - 密态SSLR/SSGLM**
- **参数估计方法:**
- 二阶优化器:迭代重加权最小二乘法(IRLS)。
- 一阶优化器:随机梯度下降(SGD)。
- **优缺点:**
- 优点:初始化准确,收敛速度快。
- 缺点:计算/通信复杂度高。
- **秘密分享操作:**
- 加法和乘法在秘密共享框架下的应用。
**3. 应用实现 - 从理论到隐语应用**
- **SSGLM参数解析与模型训练:**
- 准备SPU和数据(归一化)。
- 选择优化器进行模型训练:SGD或IRLS。
- **隐语实现的优势:**
- 可证安全性。
- 不依赖可信第三方。
- 支持多种模型分布。
- 计算效率高。
**4. 实践**
- 实际操作中,应关注数据的预处理(如归一化),优化器的选择,以及模型的训练和评估过程。
**总结:**
- 广义线性模型是一类强大的统计模型,适用于多种数据科学问题,如分类和回归任务。
- 在隐私保护机器学习领域,利用如隐语这样的框架,可以安全地实施GLM,同时保证数据的安全性和模型的性能。