转化率的问题,跟抛硬币其实是一样的问题。一个用户转化或者没转化,一枚硬币正面或者背面。
beta分布:
其中,
可以认为a、b分别是正面和反面的次数。a=1,b=1时,是均匀分布。
使用beta分布作为先验,伯努利分布作为似然,那么后验分布也是beta分布。
如果N次实验出现z次正面,那么由贝叶斯公式,
Beta(a后验,b后验) = Beta(a先验+a似然, b先验+b似然)
下图取自Doing Bayesian Data Analysis 6.3.1节
下面用趣学贝叶斯统计第15章的例子。先验分布取Beta(3,7)
x <- seq(0,1,length=10000)
beta_dist <-data.frame(cbind(x, dbeta(x,3,7)))
ggplot(beta_dist, aes(x,V2))+geom_line()