均值和方差确定了,高斯分布的形状就确定了。
解释概率密度函数,如果均值和方差确定了。那么给出一个x,可以计算出f(x),f(x)是概率密度函数,f(x)越大代表概率密度函数越大,概率密度越大对应的概率就越大,但需要注意:f(x)不是概率。
在机器学习中误差ε(i)是随机变量,当数据量多了的话ε(i)服从正太分布!
∏是连乘符号,找到多个概率密度相乘最大的时刻来模拟多个概率相乘最大!
找到最大总(m个样本的总)似然最大的时刻,也就是最优解!也就是这m个数据最贴合的正态分布!
L(θ)中的L指的是Likelihood,
求解最大似然函数的最大值,就是求连乘的最大值,不太好求解。把连乘转换成连加!