模型概述
广义线性模型(General Linear Model)是一类常见的机器学习监督模型。
问题定义
已知训练样本集 { x i , y i } , i = 1 , 2 , . . . , m \{x^i,y^i\}, i=1,2,...,m { xi,yi},i=1,2,...,m, 其中m为样本个数, x i = [ x 1 i , x 2 i , . . . , x n i ] x^i=[x_1^i, x_2^i, ..., x_n^i] xi=[x1i,x2i,...,xni]为第i个样本的n维特征, y i y^i yi为第i个样本的目标值。欲训练一个监督学习模型(分类或回归) h θ h_\theta hθ,使得对y的预估值 y ^ \hat{y} y^满足 y ^ = h θ ( x ) \hat{y}=h_\theta(x) y^=hθ(x)其中 θ \theta θ为模型参数。
模型假设
- 在给定x的条件下,y的充分统计量1满足指数族分布2分布,即 T ( y ) ∣ x ∼ E x p o n e n t i a l F a m i l y ( η ) T(y)|x\sim Exponential Family(\eta) T(y)∣x∼ExponentialFamily(η)
其中,
T(y)为y的充分统计量,在本文中,我们取 T ( y ) = y T(y) = y T(y)=y。
η \eta η为指数族分布参数,且指数族分布概率公式为
P ( y ) = b ( y ) e x p ( η ∗ y − a ( η ) ) P(y) = b(y)exp(\eta*y-a(\eta)) P(y)=b(y)exp(η∗y−a(η)) - 所学的监督模型输出为在给定x的条件下T(y)的期望,即 h θ ( x ) = E ( T ( y ) ∣ x ) h_\theta(x)=E(T(y)|x) hθ(x)=E(T(y)∣x)
- 假设参数 η \eta η与样本 x x x为线性关系,即 η = θ T x = ∑ i = 1 m θ i x i \eta=\theta^Tx=\sum_{i=1}^m\theta_ix_i η=θTx=∑i=1m