二维ising模型概率c语言_伯努利混合模型(Bernoulli Mixture Model)

本文介绍了伯努利混合模型(BMM)在处理离散二进制数据时的应用,包括二维伯努利、多维伯努利和多变量伯努利分布的混合模型。通过EM算法进行参数的极大似然估计,适用于聚类分析。文章详细阐述了BMM的理论基础和推导过程,并提出了C语言实现的可能性。
摘要由CSDN通过智能技术生成

一、前言

笔者本学期有一门数据挖掘的课程,教授重点讲解了有限混合模型(Finite Mixture Model),是聚类分析常用的方法之一,其中最经典的就是大家所熟知的高斯混合模型(Gaussian Mixture Model,GMM)。因此笔者参考GMM的推导公式,对伯努利混合模型(Bernoulli Mixture Model,BMM)也进行了相同方式的推导,并通过EM算法(Expectation–maximization algorithm)实现了对BMM参数的极大似然估计。相信对GMM比较了解的小伙伴们,也一定可以自己推导出更加简单的BMM。如果你不了解GMM,这也不会影响你掌握本文的BMM。

我们知道GMM通常用于对变量空间是连续的数据进行聚类,而BMM则适用于处理离散的数据,尤其是二进制格式的数据。本文首先会介绍单独的伯努利分布,包括三种概率分布模型:二维伯努利模型,多维伯努利模型,以及多变量伯努利模型;其次,分别对三种模型建立其混合模型,并对其参数进行极大似然估计。

二、伯努利分布 (Bernoulli distribution)

2.1. 二维伯努利分布(Two-dimensional Bernoulli distribution)

二维伯努利分布是关于二维布尔向量

的概率分布,其中
,且满足
,及
中只有一个为1;设参数向量
,分别表示
以及
的概率,且满足
。其概率分布函数为:

(1)

由此可见,二维伯努利也可考虑成一维伯努利去应用,也就是我们本科所学的伯努利实验,这里称其为二维是为了与后面介绍的多维伯努利相一致。二维伯努利最简单的应用就是抛硬币问题,一个硬币共有两个面,每次实验只会出现一个面朝上。因此二维伯努利模型可处理类似如下二进制数据集:

2.2. 多维伯努利分布 (Multi-dimensional Bernoulli distribution)

多维伯努利分布的随机变量由二维拓展为了

维布尔向量
,其中
,且满足
,及向量
中只有一个元素为1;设参数向量
,其中
,表示为
的概率,且满足
  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值