我们从两种角度来推导.
Bernoulli Distribution
对于任意一个样本 ( x , y ) (x,y) (x,y), 我们希望模型能够预测
P ( y ∣ x ) = { p ^ if y = 1 1 − p ^ if y = 0 P(y|x) = \begin{cases} \hat{p} & \text{if $y=1$}\\ 1- \hat{p} & \text{if $y=0$}\\ \end{cases} P(y∣x)={
p^1−p^if y=1if y=0
可以简写为
P ( y ∣ x ) = p ^ y ( 1 − p ^ ) 1 − y P(y|x)=\hat{p}^y(1-\hat{p})^{1-y} P(y∣x)=p