1.(这里教授简要说明了为什么使用高斯分布,一个原因是因为高斯分布便于计算;另一个原因是在处理实际问题的过程中,如果我们使用线性回归让后尝试测量误差的分布,大多情况下误差都服从高斯分布。高斯模型对于这类对于这类回归问题中的误差来说是一个很好的假设。另外,许多随机变量之和趋于服从高斯分布,如果误差是有许多效应共同导致的,例如卖家的情绪、买家的情绪、房子是否有花园、房间的壁炉数量等等,所有这些效应都是独立的,那么根据中心极限定理,这些效应的总和会近似的服从高斯分布。)
2.1似然函数的理解
2.2在关于训练数据的概率假设中,最小二乘回归与
θ
的最大似然估计一致。也正是因为最小二乘回归其实是再做最大似然估计,所以我们才会强调最小二乘是一种“很自然”的方法。(不过,概率假设并不是证明“最小二乘是一种非常易用的、合理的求解过程”这一结论的必要条件,这只是众多假设中的一种,最小二乘在这种假设下合理,除此之外还有其他假设也可以证明这一结论。)
reference:http://nbviewer.jupyter.org/github/zlotus/notes-LSJU-machine-learning/blob/master/chapter03.ipynb#3.-线性模型的概率解释