学习笔记|《白话机器学习的数学》
(我的理解,联合概率是多个条件概率连乘,概率尽可能大,说明在某个条件下,概率尽可能大,也就代表误差尽可能小,这就是怎么确定θ为最优的一个思路,求联合函数的最大值,从而确定参数θ)。要注意一点,在正则化中,我们要知道对正则化项进行偏微分时,我们对θ_0是不应用正则化的,所以R(θ)对θ_0的微分结果是0,所以参数更新表达式就应该分开写,即j=0时,以及j>0时两种更新表达式。在概率论中,对于不同的似然函数,求参数会用不同的方法,如取ln再求导(似然函数为连乘形式),按情况做出不同的措施即可。









