Em算法（python实现）——三硬币问题

WuRobb

已于 2023-01-05 17:15:34 修改

阅读量625

点赞数

文章标签： python numpy

于 2023-01-05 17:12:33 首次发布

本文链接：https://blog.csdn.net/wurobb/article/details/128566810

版权

Em算法（python实现）——三硬币问题

三硬币模型
EM算法
ref

三硬币模型

已知有A，B，C三枚硬币，他们正面朝上的概率分别是 π , p , q 。现在给出规则：第一次扔A硬币，如果A正面朝上，则抛B硬币；如果A正面朝下，则抛C硬币。

给出观测结果：1，1，0，1，0，1 （1代表第二次所扔硬币正面朝上，否则正面朝下）

来估计三枚硬币正面朝上的概率 π,𝑝,𝑞。

$\begin{align} P(y|\theta) &= \sum _z P(y,z|\theta)=\sum _z P(z|\theta)P(y|z,\theta) \\ &= \pi p^y(1-p)^{1-y}+(1-\pi) q^y(1-q)^{1-y} \end{align}$

其中，y是观测变量，z表示A的结果（不可观测）。 $\theta = (π , p , q)是参数。$
其中Y=（Y1,…,Yn)观测数据的似然函数为：
$P(Y|\theta) = \prod_{j=i}^n\pi p^{y_j}(1-p)^{1-y_j}+(1-\pi) q^y_j(1-q)^{1-y_j}$

参数的极大似然估计为：
$\hat \theta = arg \underset {\theta}{max} log P(Y|\theta)$

EM算法

1. 计算硬币B的概率
  $\mu_j^{i+1} = \frac{\pi ^i (p^i)^y(1-p^i )^{1-y}}{\pi ^i (p^i )^y(1-p^i )^{1-y}+(1-\pi ^i ) (q^i )^y(1-q^i )^{1-y}}$
1. 更新参数估计值
  $\pi ^{i+1} = avg(\mu^{i+1})$

$^{i+1} = \frac{avg(\mu^{i+1}y)}{avg(\mu^{i+1})}$

$^{i+1} = \frac{(avg(1-\mu^{i+1})y)}{avg(1-\mu^{i+1})}$

3.重复1，2直至参数收敛


class Em3Coins:
    def __init__(self, pi, p, q):
        self.pi = pi
        self.p = p
        self.q = q
        
    def update(self, y):
        u_i_new = self.pi*self.p**y*(1-self.p)**(1-y)/(
            self.pi*self.p**y*(1-self.p)**(1-y) + 
            (1-self.pi)*self.q**y*(1-self.q)**(1-y))
        self.pi = np.mean(u_i_new)
        self.p = u_i_new.dot(y)/np.sum(u_i_new)
        self.q = (1-u_i_new).dot(y)/np.sum(u_i_new)
        
    def train(self, y, epochs=20):
        print("*"*10, "Training", "*"*10)
        for epoch in range(epochs):
            self.update(y)
            print("="*10, "epoch: ", epoch+1, "="*10)
            print("π = %.2f"%self.pi,
                  "p =%.2f"%self.p,
                  "q =%.2f"%self.q)
        
        print("*"*10, "Train Done", "*"*10)
        print("π = %.2f"%self.pi,
                  "p =%.2f"%self.p,
                  "q =%.2f"%self.q)

运行

import numpy as np

y = np.array([1,1,0,1,0,0,1,0,1,1])

# 初始化概率
em = Em3Coins(0.4,0.6,0.7)
em.train(y)

''' 
输出
********** Train Done **********
π = 0.50 p =0.34 q =0.86
'''