机器学习笔记之狄利克雷过程(三)随机测度的生成过程(折棍子过程)

引言

上一节使用公式推导的方式介绍了狄利克雷过程标量参数 α \alpha α的极端取值对于生成的随机测度 G ( i ) \mathcal G^{(i)} G(i)离散程度的影响。本节从随机测度的生成角度对标量参数 α \alpha α与离散程度的关系进行描述。

回顾:狄利克雷过程——定义

已知 G ( i ) \mathcal G^{(i)} G(i)服从狄利克雷过程 DP ( α , H ) \text{DP}(\alpha,\mathcal H) DP(α,H)
G ( i ) ∼ DP ( α , H ) \mathcal G^{(i)} \sim \text{DP}(\alpha,\mathcal H) G(i)DP(α,H)

其中, G ( i ) \mathcal G^{(i)} G(i)被称作随机测度( Random Measure \text{Random Measure} Random Measure),它是从狄利克雷过程 DP ( α , H ) \text{DP}(\alpha,\mathcal H) DP(α,H)中生成的一个样本;并且它的本质是一个离散型概率分布

假设该分布 G ( i ) \mathcal G^{(i)} G(i)是一个一维随机分布,并且其内部包含 K \mathcal K K个离散特征:
G ( i ) = ( g 1 ( i ) , g 2 ( i ) , ⋯   , g K ( i ) ) T ∑ k = 1 K g k ( i ) = 1 \mathcal G^{(i)} = (g_1^{(i)},g_2^{(i)},\cdots,g_{\mathcal K}^{(i)})^T \quad \sum_{k=1}^{\mathcal K} g_k^{(i)} = 1 G(i)=(g1(i),g2(i),,gK(i))Tk=1Kgk(i)=1
其中 g k ( i ) g_k^{(i)} gk(i)表示 G ( i ) \mathcal G^{(i)} G(i)中的第 k k k个特征,它的权重信息。其他权重信息对应的示例结果表示如下:
一维随机测度示例
其中,图像中竖线的长度就表示特征权重信息的大小。我们将 K \mathcal K K个权重结果划分成 D \mathcal D D个区域,每个区域中可能存在若干个权重结果:

  • 其中 a d ( d = 1 , 2 , ⋯   , D ) a_d(d=1,2,\cdots,\mathcal D) ad(d=1,2,,D)表示区域编号; G ( i ) ( a d ) \mathcal G^{(i)}(a_d) G(i)(ad)表示区域 a d a_d ad内存在的权重结果之和。
  • 这仅是一个特征信息重组的部分,总量没有发生变化。
    { G ( i ) ( a 1 ) , G ( i ) ( a
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

静静的喝酒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值