涉及到的两个概念就是 :
广义线性模型(Generalized Linear Models) 和 指数分布族 (The exponential family)
有一个这样神奇的式子:
p(y;η)=b(y)eηTT(y)−a(η)
来表示指数分布族,只要我们给定特定的
T(y),a(y),b(y)
就可以用如上式子表示大部分的分布;
如 伯努利分布,高斯分布,狄利克雷分布,泊松分布等等;
然而通过指数分布族来表示广义线性模型的话需要满足三个条件,具体条件讲义上有,我也懒得搬了,贴一个Jerrylead大神的图吧…
重点是,我想了一下这里为什么提到伯努利分布和高斯分布,这个用途;
伯努利分布,只有0,1两种结果,所以是在二分类问题中会用到,也就是之前提到的分类问题;
而高斯分布,是我们在求解最小化损失函数的时候,当时用最小二乘法表示,是因为假设误差函数满足高斯分布的时候的最大似然函数中部分的 log 形式
之前有点疑惑,感觉有点混淆模型和分布的概念
现在感觉,分布是对于结果集,或者是训练集的一个描述,应该是根据分布的情况选取相应的模型
大致这样理解吧