汤普森采样(Thompson sampling)
1、Beta分布定义域:[0,1]参数:α,β\alpha,\betaα,β,均为正值参数,又称为形状参数1.1 Beta分布的概率密度函数f(x,α,β)=constant⋅xα−1⋅(1−x)β−1=xα−1(1−x)β−1∫01uα−1(1−u)β−1 du=Γ(α+β)Γ(α)Γ(β)xα−1(1−x)β−1=1B(α,β)xα−1(1−x)β−1f(x,\alpha,\beta) =constant \cdot x^{\alpha-1} \cdot (1-x)^{\beta-1} \\
原创
2021-02-02 08:00:10 ·
12538 阅读 ·
1 评论