- 调查吸烟者和吸毒者的比例在人群中的比例
- 向每5个人发放同一个问题,邀请他们回答
- 在保证匿名性质的同时,得到了一些不知归属的成组答案
- EM算法
- 随机化
- 不知道答案是哪一个问题,就无法推测吸烟和吸食大麻的比例
- 不知道这两个的比例,就不知道答案属于哪一个问题
- E部
- 随机的为一组数据归类,并且通过归类得到他们的可能性
- 在估算未知变量也就是问题归属的期望
- M步
- 通过可能性,估算吸烟者和吸食大麻的概率,
- 由于该概率是可能性最大的,
- 直到较为稳定的数值就停止
- KMEANS算法
- 目标是获得两个中心坐标,从而将梨子和苹果进行分割
- EM算法在分类的同时,还能找到更多的梨子和苹果
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-MpJEUjNI-1619627963065)(C:\Users\jiang000\AppData\Roaming\Typora\typora-user-images\image-20210428233032835.png)]