逻辑回归LR与广义线性模型GLM开发实践笔记_广义线性模型预测纯风险保费-CSDN博客

本文链接：https://blog.csdn.net/m0_68514117/article/details/139862372

广义线性模型(GLM)：风险保费预测，根据要提供的保障责任，计算预期总索赔额•直接对纯保费建模 ·tweedie 分布(1, 2) •也可以通过两步建模间接近似：纯保费=索赔次数*平均索赔金额 ·索赔次数：泊松分布、负二项分布 •平均索赔金额：伽马分布、逆高斯分布线性回归：它是GLM的一个基本形式，其假设响应变量 Y的真实值由两部分组成Yactual =βo+x1βI+x2β2+·…+xpβp+E 系统组件(system component)：线性预测器=xtβ (数值项，可拟合)误差组件(error component)：白噪声~N(0，1)(高斯随机变量) 一个广义线性模型有三个关键组件： 1.系统组件：是一个线性预测器η=βTx ，x 为自变量，β是定义的未知参数 2.随机组件：是一个指数族分布作为响应变量Y概率分布 p(Y;0) *** θ 是分布的自然参数 *** θ和μ存在—一映射关系，我们用函数y表示这种关系 3.连接函数：使得η=g(μ)，描述系统组件和随机组件之间的关系

逻辑回归（Logistic Regression，LR）和广义线性模型（Generalized Linear Model，GLM）是常用的建模方法，在分类问题中广泛应用。下面将介绍逻辑回归与广义线性模型的开发实践。

数据准备：首先，需要准备好数据集。数据集应包含目标变量和一系列特征变量。对于逻辑回归，目标变量通常是二分类变量，如是否购买某个产品。对于广义线性模型，目标变量可以是二分类变量、多分类变量或连续变量。
特征工程：在进行建模之前，需要对数据进行特征工程处理。这包括缺失值填充、异常值处理、特征选择、特征变换等。特征工程的目的是提取出最具预测能力的特征。
模型训练：使用准备好的数据集进行模型训练。对于逻辑回归，可以使用最大似然估计方法进行参数估计。对于广义线性模型，可以使用最大似然估计或其他适当的方法进行参数估计。
模型评估：完成模型训练后，需要对模型进行评估。可以使用一系列评估指标，如准确率、精确率、召回率、F1值等。还可以使用交叉验证或留出法等方法进行模型评估。
模型优化：根据评估结果，可以对模型进行进一步优化。可以尝试不同的特征工程方法、调整超参数、使用正则化等方法来提高模型的性能。
模型应用：经过优化后的模型可以用于预测新的数据。可以使用模型对新的样本进行分类，预测目标变量的取值。

逻辑回归和广义线性模型在数据挖掘和机器学习领域具有广泛的应用。它们可以用于二分类、多分类和回归问题，并且易于理解和解释。同时，也可以使用特征工程、模型优化等方法来提高模型性能。在实际开发中，可以根据具体问题选择逻辑回归或广义线性模型，并结合实践经验对模型进行优化。