综述
广义线性模型在各大保险公司有着广泛的应用,其中应用比较成熟的方向应该是车险定价这一块。接下来,咱们就简单讨论一下什么是广义线性模型?为什么要用广义线性模型?以及怎么用广义线性模型?
(注:全程没有公式推导,水货文章老少咸宜)
What?
什么是广义线性模型?首先假设大家已经对线性模型有一定的了解,这里就不详细展开。那么“广义”的区别是什么,又有什么异同呢?广义,顾名思义就是范围更宽广的意思,是包含关系。
对于一般形式的线性模型y_hat=ax+b,我们都假设因变量y是服从正态分布的,而线性模型的极大似然估计的解与最小二乘法中的解是一样的(详细的公式就不推导了,网上一搜一大堆),当且仅有这么一家特例。那么问题来了,当因变量y不是服从正态分布的时候,那一般形式的线性模型拟合效果肯定就很差,特别是表现在数据分布的两端。
这个时候就需要引入广义线性模型g(y_hat)=ax+b,g()称作连接函数,广义线性模型则放宽了因变量y要服从正态分布的限制,只需服从指数分布族里的分布就可以。指数分布族是指分布的概率密度函数可以转化成以下形式:
式中的θ为自然参数,与分布的均值μ有关,φ是离散参数,与分布的均值无关,与方差有关。指数分布族包含了,正态分布、泊松分布、伽马分布、二项分布、逆高斯分布、tw