von Mises-Fisher Distribution (Appendix 1)

SATAN 先生

已于 2024-04-23 16:26:27 修改

阅读量467

点赞数 4

分类专栏：机器学习数学文章标签：机器学习概率论

于 2024-04-10 09:24:10 首次发布

本文链接：https://blog.csdn.net/qq_32527569/article/details/137478820

版权

机器学习同时被 2 个专栏收录

23 篇文章 1 订阅

订阅专栏

数学

13 篇文章 0 订阅

订阅专栏

2. Relation to Normal Distribution

疑问：有没有不各向同性的 vMF？
答：应该是没有的，如果想让各方向偏离中心的速度不一致，则协方差矩阵不为 $\bm{I}$ 的倍数. 正态分布的概率密度函数为： $\begin{aligned} f(\bm{x}) = \frac{1}{\sqrt{(2\pi)^p |\Sigma|}} e^{-\frac{1}{2} (\bm{x}-\bm{\mu})^\intercal\Sigma^{-1}(\bm{x}-\bm{\mu})} \end{aligned}$ 类比上面的推导，我们需要得出形似： $\begin{aligned} G_p(\bm{x}; \bm{\mu}, \kappa) &= C(p,\kappa,r) exp\left(\kappa r \frac{\bm{\mu}^\intercal}{r} \Sigma^{-1} \bm{x} \right) \end{aligned}$ 的东西，所以，必要的，需要： $\begin{aligned} \bm{x}^{\intercal} \Sigma^{-1} \bm{x} &= const \end{aligned}$ 我们知道，要想让 $\bm{x}^{\intercal} \Sigma^{-1} \bm{x} = const$ 表示为球，则必须使 $\Sigma^{-1}=\alpha \bm{I}$ ，所以，假设不了“协方差矩阵不为 $\bm{I}$ 的倍”, 也就不可能存在不各向同性的 vMF.

[注]： $\bm{x}^{\intercal} \Sigma^{-1} \bm{x} = const$ ，表示一般的超椭球。

等等！对于 $\bm{x}$ 来说, 即使它不是单位向量，也代表了一个方向， $\frac{\bm{x}}{\|\bm{x}\|}$ 的分布会是非各向同性的 vMF 吗？有可能是哎！
假设 $\bm{y} = \begin{bmatrix} y_1 \\ y_2 \end{bmatrix} = \begin{bmatrix} 1 & 0 \\ 0 & 2 \end{bmatrix} \begin{bmatrix} x_1 \\ x_2 \end{bmatrix} = \bm{Ax}$ ， $\bm{y}$ 代表单位圆的话，则 $\bm{x}$ 在椭圆 $x_1^2 + (2x_2)^2 = 1$ 上，如下图：

可以看到，B 和 D 点是对应的，那么弧 AB 和 AD 的“点数”应该是一样的，而弧 AB 对应的方向却在弧 AC 上，即 AD 段对应的方向，被压缩在了 AC 段，如果采样 $\bm{y}$ 的话，对应的 $\bm{x}$ 方向会更集中趋于椭圆的长轴，实现了“非各向同性”，只不过分布在椭圆上，且采样后需要归一化处理。

5. 采样

$t$ 的概率密度函数推导

直接将 $\bm{\mu}^\intercal\bm{x}$ 代入 $f_p(\bm{x}; \bm{\mu}, \kappa)$ , 得: $\begin{aligned} f_p(\bm{x}; \bm{\mu}, \kappa) &= C_p(\kappa) exp(\kappa \bm{\mu}^\intercal\bm{x}) & \\ &= C_p(\kappa) exp(\kappa t) & t \in [-1, 1] \\ &= C_p(\kappa) exp(\kappa cos\theta) & \theta \in [0, \pi] \end{aligned}$ 注意这是 $\bm{x}$ 一点处的概率密度. 沿着 $t$ 处的切子球求积分, 以得到 $t$ 或 $\theta$ 处的整个概率密度: $\begin{aligned} \int_{切子球} f_p(\bm{x}; \bm{\mu}, \kappa) ds &= \int_{切子球} C_p(\kappa) exp(\kappa \bm{x}) ds & \\ &= C_p(\kappa) exp(\kappa t)\frac{2\pi^{\frac{p-1}{2}}}{\Gamma(\frac{p-1}{2})}(1-t^2)^\frac{p-2}{2} & S^{p-2} 的表面积 \propto r^{p-2} \\ &= C_p(\kappa) exp(\kappa cos\theta) \frac{2\pi^{\frac{p-1}{2}}}{\Gamma(\frac{p-1}{2})} sin^{p-2}\theta & \end{aligned}$ 根据 n-sphere - Wikipedia, 切子球 $S^{p-2}$ 的表面积 $S_{p-2} = \frac{2\pi^{\frac{p-1}{2}}}{\Gamma(\frac{p-1}{2})} r^{p-2}$ , 再沿 $t$ 或 $\theta$ 积分: $\begin{aligned} & \int_0^\pi C_p(\kappa) exp(\kappa cos\theta) \frac{2\pi^{\frac{p-1}{2}}}{\Gamma(\frac{p-1}{2})} sin^{p-2}\theta d\theta \\ =& C_p(\kappa) \frac{2\pi^{\frac{p-1}{2}}}{\Gamma(\frac{p-1}{2})} \int_{1}^{-1} exp(\kappa t) (1-t^2)^\frac{p-2}{2} (\frac{-1}{\sqrt{1-t^2}} dt) & \because cos0=1,~ cos\pi=-1 \\ =& C_p(\kappa) \frac{2\pi^{\frac{p-1}{2}}}{\Gamma(\frac{p-1}{2})} \int_{-1}^{1} exp(\kappa t) (1-t^2)^{\frac{p-3}{2}} dt \\ =& C_p(\kappa) \frac{2\pi^{\nu+\frac{1}{2}}}{\Gamma(\nu+\frac{1}{2})} \int_{-1}^{1} exp(\kappa t) (1-t^2)^{\nu-\frac{1}{2}} dt & 令~\nu=\frac{p}{2}-1 \\ \end{aligned}$ 那么, 将 $\begin{aligned} \int_{-1}^{1} exp(\kappa t)(1-t^2)^{\nu-\frac{1}{2}} dt &= \frac{\Gamma({\frac{1}{2}})\Gamma(\nu+{\frac{1}{2}})I_{\nu}(\kappa)}{(\kappa / 2)^\nu} & [I_{\nu} 的公式] \\ &= \frac{\Gamma({\frac{1}{2}})\Gamma(\frac{p-1}{2})I_{\frac{p}{2}-1}(\kappa)}{(\kappa / 2)^{\frac{p}{2}-1}} \end{aligned}$ 代入, 得: $\begin{aligned} & C_p(\kappa) \frac{2\pi^{\nu+\frac{1}{2}}}{\Gamma(\nu+\frac{1}{2})} \int_{-1}^{1} exp(\kappa t) (1-t^2)^{\nu-\frac{1}{2}} dt \\ =& C_p(\kappa) \frac{2\pi^{\nu+\frac{1}{2}}}{\Gamma(\nu+\frac{1}{2})} \frac{\Gamma({\frac{1}{2}})\Gamma(\nu+\frac{1}{2}) I_{\nu}(\kappa)}{(\kappa / 2)^{\nu}} \\ =& \frac{2\pi^{\nu+1}I_{\nu}(\kappa)}{(\kappa / 2)^{\nu}} C_p(\kappa) & \Gamma({\frac{1}{2}}) = \pi^{\frac{1}{2}} \\ =& \frac{2\pi^{\frac{p}{2}}I_{\frac{p}{2}-1}(\kappa)}{(\kappa / 2)^{\frac{p}{2}-1}} C_p(\kappa) \\ =& \frac{(2\pi)^{\frac{p}{2}}I_{\frac{p}{2}-1}(\kappa)}{\kappa^{\frac{p}{2}-1}} C_p(\kappa) = 1 & (2) \\ \Longleftrightarrow & \\ C_p(\kappa) =& \frac{\kappa^{\frac{p}{2}-1}}{(2\pi)^{\frac{p}{2}} I_{\frac{p}{2}-1}(\kappa)} & [与 Wikipedia 一致] \end{aligned}$ 所以, 由式 $(2)$ 可得 $t$ 的概率密度函数为: $\begin{aligned} f_{radial}(t; \kappa, p) &= C_p(\kappa) \frac{2\pi^{\nu+\frac{1}{2}}}{\Gamma(\nu+\frac{1}{2})} exp(\kappa t) (1-t^2)^{\nu-\frac{1}{2}} & \nu = \frac{p}{2}-1 \\ &= \frac{(\kappa/2)^\nu}{\Gamma({\frac{1}{2}})\Gamma(\nu+{\frac{1}{2}})I_{\nu}(\kappa)} exp(\kappa t) (1-t^2)^{\nu-\frac{1}{2}} & [与 Wikipedia 一致] \\ &= \frac{(\kappa/2)^{\frac{p}{2}-1}}{\sqrt{\pi}\Gamma(\frac{p-1}{2})I_{\frac{p}{2}-1}(\kappa)} exp(\kappa t) (1-t^2)^{\frac{p-3}{2}} \end{aligned}$

单位球上的均匀分布采样

实际上, 从标准正态分布 $N or ma l (0, 1)$ 中采样 $p$ 个数, 组成向量 $\bm{v}$ , 归一化, 就实现了球 $S_{p-1}$ 上的均匀采样, 并不需要多元正态分布 $\bm{I}^{(p)})$ . 因为 $p$ 个独立采样自 $N or ma l (0, 1)$ 的 $p$ 个数概率是: $\begin{aligned} & \prod_{i=1}^p \frac{1}{\sqrt{2\pi}} exp(-\frac{x_i^2}{2}) \\ =& \frac{1}{(2\pi)^\frac{p}{2}}exp\left(-\frac{\sum_{i=1}^p x_i^2}{2}\right) \end{aligned}$ 恰好是 $p$ 元标准正态分布的概率密度.

5.2 拒绝采样

为了与原论文一致, 本小节使用 $m$ 代替 $p$ .

首先, 设 $\sim Be(\alpha, \beta)$ , 概率密度函数为: $\begin{aligned} f(y; \alpha, \beta) &= \frac{y^{\alpha-1}(1-y)^{\beta-1}}{\int_0^1 u^{\alpha-1}(1-u)^{\beta-1} du} \\ &= \frac{\Gamma(\alpha+\beta)}{\Gamma(\alpha)\Gamma(\beta)} y^{\alpha-1}(1-y)^{\beta-1} \\ &= \frac{1}{\Beta(\alpha,\beta)} y^{\alpha-1}(1-y)^{\beta-1} \end{aligned}$ 其中 $\in (0,1), \alpha, \beta > 0$ . 令 $\begin{aligned} X = \frac{1-(1+b)Y}{1-(1-b)Y} &\Leftrightarrow Y = \frac{1-X}{(1+b)-(1-b)X} \\ b &\in (0,1) \end{aligned}$ 代入上述概率密度函数 $\alpha, \beta)$ , 并令 $\alpha=\beta=\frac{m-1}{2}$ 得: $\begin{aligned} &f(\frac{1-x}{(1+b)-(1-b)x}; \frac{m-1}{2}, \frac{m-1}{2}) \\ =& \frac{1}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \left(\left(\frac{1-x}{(1+b)-(1-b)x}\right) * \left(1-\frac{1-x}{(1+b)-(1-b)x}\right)\right)^{\frac{m-1}{2}-1} \\ =& \frac{1}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \left(\left(\frac{1-x}{(1+b)-(1-b)x}\right) * \left(\frac{(1+b)-(1-b)x - (1-x)}{(1+b)-(1-b)x}\right)\right)^{\frac{m-3}{2}} \\ =& \frac{1}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \left(\left(\frac{1-x}{(1+b)-(1-b)x}\right) * \left(\frac{b(1+x)}{(1+b)-(1-b)x}\right)\right)^{\frac{m-3}{2}} \\ =& \frac{1}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \left(\frac{b(1-x^2)}{[(1+b)-(1-b)x]^2}\right)^{\frac{m-3}{2}} \\ =& \frac{b^{\frac{m-3}{2}}}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \frac{(1-x^2)^{\frac{m-3}{2}}}{[(1+b)-(1-b)x]^{m-3}} \\ =& e(x,b) ~~~~~ 其中 ~ x \in (-1,1), b \in (0,1) \end{aligned}$ 与论文 Computer Generation of Distributions on the m-spher [1] 不一致, 但我不知道问题出在哪里. 论文里明明说:

却给出了:

由拒绝采样法的 $f_{radial}(x;\kappa,m) \le M*e(x,b)$ , 计算: $\begin{aligned} M &= \max_x \frac{f_{radial}(x;\kappa,m)}{e(x, b)} \\ &= \max_x \frac{ \frac{(\kappa/2)^\nu}{\Gamma({\frac{1}{2}})\Gamma(\nu+{\frac{1}{2}})I_{\nu}(\kappa)} (1-x^2)^{\frac{m-3}{2}} exp(\kappa x) }{ \frac{b^{\frac{m-3}{2}}}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \frac{(1-x^2)^{\frac{m-3}{2}}}{[(1+b)-(1-b)x]^{m-3}} } \\ &= \max_x \frac{ \frac{(\kappa/2)^\nu}{\Gamma({\frac{1}{2}})\Gamma(\nu+{\frac{1}{2}})I_{\nu}(\kappa)} exp(\kappa x) }{ \frac{b^{\frac{m-3}{2}}}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \frac{1}{[(1+b)-(1-b)x]^{m-3}} } \\ &= \max_x \frac{(\kappa/2)^\nu}{\Gamma({\frac{1}{2}})\Gamma(\nu+{\frac{1}{2}})I_{\nu}(\kappa)} \frac{\Beta(\frac{m-1}{2},\frac{m-1}{2})}{b^{\frac{m-3}{2}}} [(1+b)-(1-b)x]^{m-3} exp(\kappa x) \end{aligned}$ 接下来求极值点: $\begin{aligned} & \frac{\partial \left([(1+b)-(1-b)x]^{m-3} exp(\kappa x)\right)}{\partial x} \\ =& (m-3)[(1+b)-(1-b)x]^{m-4} * [-(1-b)] exp(\kappa x) \\ +& [(1+b)-(1-b)x]^{m-3} \kappa exp(\kappa x) = 0 \\ \Rightarrow \\ & (m-3) * [-(1-b)] + [(1+b)-(1-b)x] \kappa = 0 \\ & (1+b)-(1-b)x = \frac{(m-3)(1-b)}{\kappa} \\ & (1-b)x = (1+b) - \frac{(m-3)(1-b)}{\kappa} \\ & 解:~ x_0 = \frac{1+b}{1-b} - \frac{m-3}{\kappa} \end{aligned}$ 因为 $\in (0,1), x \in [-1, 1]$ , 所以 $\ge 0$ , 可知, 在经过简约之后, $\frac{\partial \left([(1+b)-(1-b)x]^{m-3} exp(\kappa x)\right)}{\partial x}$ 的符号不变, $\kappa$ 是线性的, 单调递减. 那么 $\frac{f_{radial}(x;\kappa,m)}{e(x, b)}$ 先曾后减, 在 $x_0$ 处取得最大值.

代入之后, 求得 $M$ , 为使接受率最大化(最小化 $M$ ), 对 $b$ 求导: $\begin{aligned} & \frac{\partial \left( \frac{[(1+b)-(1-b)x_0]^{m-3} exp(\kappa x_0)}{b^{\frac{m-3}{2}}} \right)}{\partial b} \\ =& exp(-\frac{m-3}{\kappa}) \frac{\partial \left( \frac{[\frac{(m-3)(1-b)}{\kappa}]^{m-3} exp(\kappa \frac{1+b}{1-b})}{b^{\frac{m-3}{2}}} \right)}{\partial b} \\ =& \left(\frac{m-3}{\kappa}\right)^{m-3} exp(-\frac{m-3}{\kappa}) \frac{\partial \left( \frac{(1-b)^{m-3} exp(\kappa \frac{1+b}{1-b})}{b^{\frac{m-3}{2}}} \right)}{\partial b} = 0 \\ \Rightarrow \\ =& \frac{\partial \left( \frac{(1-b)^{m-3} exp(\kappa \frac{1+b}{1-b})}{b^{\frac{m-3}{2}}} \right)}{\partial b} = 0 \\ =& \frac{m-3}{2} (1-\frac{1}{b^2}) (b+\frac{1}{b}-2)^{\frac{m-5}{2}} exp(\kappa \frac{1+b}{1-b}) + (b+\frac{1}{b}-2)^{\frac{m-3}{2}} \frac{2\kappa}{(1-b)^2} exp(\kappa \frac{1+b}{1-b}) \\ \Rightarrow \\ & \frac{m-3}{2} (1-\frac{1}{b^2}) + (b+\frac{1}{b}-2) \frac{2\kappa}{(1-b)^2} = 0 \\ & (m-3)(1-\frac{1}{b^2}) + \frac{4\kappa}{b} = 0 \\ & (m-3)(b^2-1) + 4\kappa b = 0 \\ =& (m-3)b^2 + 4\kappa b - (m-3) \\ & 解:~ b_0 = \frac{-2\kappa+\sqrt{4\kappa^2+(m-3)^2}}{m-3} \in (0,1) \end{aligned}$

如果把 $\gt 0$ 和 $2\kappa \gt 0$ 都看作三角形的直角边, $\sqrt{4\kappa^2+(m-3)^2}$ 为斜边, 则 $b_0 = sec\theta - tan\theta$ , 又 $\theta \in (0, \frac{\pi}{2})$ , 故 $b_0 \in (0,1)$

所有的简约都不改变 $\frac{\partial M}{\partial b}$ 的符号, 所以, $M$ 随 b 先减后增, $b_0$ 是 $M$ 的最小值点.

以上所有的计算中, 对于原论文中的 $e (x, b)$ 和本博文计算的 $e (x, b)$ , 差别只在于 $(m - 1)$ 和 $(m - 3)$ , 其他都一样. 继续计算 $x_0$ : $\begin{aligned} 1 + b_0 &= 1 + \frac{-2\kappa+\sqrt{4\kappa^2+(m-3)^2}}{m-3} \\ &= \frac{m-3 -2\kappa+\sqrt{4\kappa^2+(m-3)^2}}{m-3} \\ &= \frac{m-3 + \sqrt{4\kappa^2+(m-3)^2} -2\kappa}{m-3} \\ 1 - b_0 &= 1 - \frac{-2\kappa+\sqrt{4\kappa^2+(m-3)^2}}{m-3} \\ &= \frac{m-3 + 2\kappa - \sqrt{4\kappa^2+(m-3)^2}}{m-3} \\ &= \frac{m-3 + 2\kappa - \sqrt{4\kappa^2+(m-3)^2}}{m-3} \\ x_0 &= \frac{1+b_0}{1-b_0} - \frac{m-3}{\kappa} \\ &= \frac{m-3 - 2\kappa + \sqrt{4\kappa^2+(m-3)^2}}{m-3 + 2\kappa - \sqrt{4\kappa^2+(m-3)^2}} - \frac{m-3}{\kappa} \\ &= \frac{ (m-3 + \sqrt{4\kappa^2+(m-3)^2} - 2\kappa) (m-3 + \sqrt{4\kappa^2+(m-3)^2} + 2\kappa) }{(m-3 + 2\kappa)^2 - (4\kappa^2+(m-3)^2)} - \frac{m-3}{\kappa} \\ &= \frac{(m-3 + \sqrt{4\kappa^2+(m-3)^2})^2 - 4\kappa^2}{ (m-3)^2 + 4\kappa^2 + 4\kappa(m-3) - (4\kappa^2+(m-3)^2) } - \frac{m-3}{\kappa} \\ &= \frac{ (m-3)^2 + 4\kappa^2+(m-3)^2 + 2(m-3)\sqrt{4\kappa^2+(m-3)^2} - 4\kappa^2 }{4\kappa(m-3)} - \frac{m-3}{\kappa} \\ &= \frac{2(m-3)^2 + 2(m-3)\sqrt{4\kappa^2+(m-3)^2}}{4\kappa(m-3)} - \frac{m-3}{\kappa} \\ &= \frac{(m-3) + \sqrt{4\kappa^2+(m-3)^2}}{2\kappa} - \frac{2(m-3)}{2\kappa} \\ &= \frac{-(m-3) + \sqrt{4\kappa^2+(m-3)^2}}{2\kappa} \in(0,1) \\ \frac{1-b_0}{1+b_0} =& \frac{m-3 + 2\kappa - \sqrt{4\kappa^2+(m-3)^2}}{m-3 - 2\kappa + \sqrt{4\kappa^2+(m-3)^2}} \\ =& \frac{ [m-3 + 2\kappa - \sqrt{4\kappa^2+(m-3)^2}][(m-3 - 2\kappa) - \sqrt{4\kappa^2+(m-3)^2}] }{ [(m-3 - 2\kappa) + \sqrt{4\kappa^2+(m-3)^2}][(m-3 - 2\kappa) - \sqrt{4\kappa^2+(m-3)^2}] } \\ =& \frac{ [(m-3 - \sqrt{4\kappa^2+(m-3)^2}) + 2\kappa ][(m-3 - \sqrt{4\kappa^2+(m-3)^2}) - 2\kappa] }{ (m-3 - 2\kappa)^2 - [4\kappa^2+(m-3)^2] } \\ =& \frac{ (m-3 - \sqrt{4\kappa^2+(m-3)^2})^2 - 4\kappa^2 }{ [(m-3)^2 + 4\kappa^2] - 4\kappa(m-3) - [4\kappa^2+(m-3)^2] } \\ =& \frac{ (m-3)^2 + 4\kappa^2+(m-3)^2 - 2(m-3)\sqrt{4\kappa^2+(m-3)^2} - 4\kappa^2 }{ -4\kappa(m-3) } \\ =& \frac{2(m-3)^2 - 2(m-3)\sqrt{4\kappa^2+(m-3)^2}}{-4\kappa(m-3)} \\ =& \frac{-(m-3) + \sqrt{4\kappa^2+(m-3)^2}}{2\kappa} = x_0 \end{aligned}$ 采样一个 $\sim Uniform(0,1)$ , $\sim Be(\frac{m-1}{2},\frac{m-1}{2}) \Rightarrow x = \frac{1-(1+b_0)y}{1-(1-b_0)y} \sim e(x,b_0)$ 当 $\lt \frac{f_{radial}(x;\kappa,m)}{M*e(x,b_0)}$ 时, 接受 $x$ 为样本. $\begin{aligned} \frac{f_{radial}(x;\kappa,m)}{M*e(x,b_0)} &= \frac{f_{radial}(x;\kappa,m)}{Mf(\frac{1-x}{(1+b_0)-(1-b_0)x}; \frac{m-1}{2}, \frac{m-1}{2})} \\ &= \frac{(\kappa/2)^\nu}{\Gamma({\frac{1}{2}})\Gamma(\nu+{\frac{1}{2}})I_{\nu}(\kappa)} \frac{\Beta(\frac{m-1}{2},\frac{m-1}{2})}{b_0^{\frac{m-3}{2}}} [(1+b_0)-(1-b_0)x]^{m-3} exp(\kappa x) / M \\ &= \frac{[(1+b_0)-(1-b_0)x]^{m-3} exp(\kappa x)}{[(1+b_0)-(1-b_0)x_0]^{m-3} exp(\kappa x_0)} \\ &= \left(\frac{(1+b_0)-(1-b_0)x}{(1+b_0)-(1-b_0)x_0}\right)^{m-3} exp(\kappa (x - x_0)) \\ log\frac{f_{radial}(x;\kappa,m)}{M*e(x,b_0)} &= (m-3) log\left(\frac{(1+b_0)-(1-b_0)x}{(1+b_0)-(1-b_0)x_0}\right) + \kappa (x - x_0) \\ &= (m-3) log\left(\frac{1-\frac{1-b_0}{1+b_0}x}{1-\frac{1-b_0}{1+b_0}x_0}\right) + \kappa (x - x_0) \\ &= (m-3) log\left(\frac{1-x_0x}{1-x_0^2}\right) + \kappa (x - x_0) \\ &= (m-3)log(1-x_0x) - (m-3)log(1-x_0^2) + \kappa (x - x_0) \\ &= \kappa x + (m-3)log(1-x_0x) - [\kappa x_0 + (m-3)log(1-x_0^2)] \\ &= \kappa x + (m-3)log(1-x_0x) - c \end{aligned}$ 即, 当 $\kappa x + (m-3)log(1-x_0x) - c$ 时接受样本 $x$ . 与 Communications in Statistics - Simulation and Computation [2] 中的判别公式一致了(除了 $(m - 3)$ 和 $(m - 1)$ ):

但是与 [1] 不一致, 且 [2] 声称 [1] 的采样方案有问题:
意思大概是作者在实践中并没有的到正确的采样, 且不知道问题出在哪里, 所以他们又根据 [1] 推导了一遍, 得出了上述接受-拒绝判别式. 但, 我也推导了一遍, 发现两者是等价的…

问题到底在哪里?

似乎所有的差别就在 $e (x, b)$ , 到底是: $\begin{aligned} e(x,b) =& \frac{b^{\frac{m-3}{2}}}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \frac{(1-x^2)^{\frac{m-3}{2}}}{[(1+b)-(1-b)x]^{m-3}} \end{aligned}$ 还是: $\begin{aligned} e(x,b) =& \frac{2b^{\frac{m-1}{2}}}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \frac{(1-x^2)^{\frac{m-3}{2}}}{[(1+b)-(1-b)x]^{m-1}} \end{aligned}$ ? ? ? ? ? ? ? 找到问题出在哪了, 保留以上过程, 以警钟长鸣 ? ? ? ? ? ? ? ?
记住, 永远不要想当然! 概率密度函数的变换不是进行一下变量代换就 OK 了的! 前面 $t$ 的概率密度函数推导中, 就知道 $t$ 和 $\theta$ 在变换的时候需要带上 $d\theta$ , 怎么现在就忘了? 根本原因是对知识的理解不够透彻. 我们的研究对象本质上是概率 $\alpha, \beta)dy$ , 而不是概率密度 $\alpha, \beta)$ , 当进行变量代换时, 不光要变换概率密度中的变量, $d y$ 也要变换, 甚至求 $[a, b]$ 区间上的概率时, $\int_a^b f(y; \alpha, \beta) dy$ , 积分区间也要变换.

在得到随机变量变换关系: $\begin{aligned} X = \frac{1-(1+b)Y}{1-(1-b)Y} &\Leftrightarrow Y = \frac{1-X}{(1+b)-(1-b)X} \end{aligned}$ 后, 假如让你积分求区间 $y_1,y_2]$ 上的概率呢? $\begin{aligned} \int_{y_1}^{y_2} f(y; \alpha, \beta) dy &= \int_{\frac{1-x_1}{(1+b)-(1-b)x_1}}^{\frac{1-x_2}{(1+b)-(1-b)x_2}} f\left(\frac{1-x}{(1+b)-(1-b)x}; \alpha, \beta\right) d\left(\frac{1-x}{(1+b)-(1-b)x}\right) \\ &= \int_{\frac{1-x_1}{(1+b)-(1-b)x_1}}^{\frac{1-x_2}{(1+b)-(1-b)x_2}} f\left(\frac{1-x}{(1+b)-(1-b)x}; \alpha, \beta\right) \frac{-2b}{[(1+b)-(1-b)x]^2}dx \end{aligned}$

$\begin{aligned} dy &= d\left(\frac{1-x}{(1+b)-(1-b)x}\right) \\ &= \frac{-[(1+b)-(1-b)x] - (1-x)[-(1-b)]}{[(1+b)-(1-b)x]^2}dx \\ &= \frac{-(1+b)+(1-b)x + (1-b) - (1-b)x}{[(1+b)-(1-b)x]^2}dx \\ &= \frac{-2b}{[(1+b)-(1-b)x]^2}dx \\ \end{aligned}$

由于 $\frac{-2b}{[(1+b)-(1-b)x]^2} \lt 0$ , 变量 $x, y$ 之间是负相关的, 那么积分式写为: $\begin{aligned} \int_{\frac{1-x_2}{(1+b)-(1-b)x_2}}^{\frac{1-x_1}{(1+b)-(1-b)x_1}} f\left(\frac{1-x}{(1+b)-(1-b)x}; \alpha, \beta\right) \frac{2b}{[(1+b)-(1-b)x]^2}dx \end{aligned}$ 所以, 关于 $x$ 的概率密度函数是: $\begin{aligned} e(x, b) =& f\left(\frac{1-x}{(1+b)-(1-b)x}; \alpha, \beta\right) \frac{2b}{[(1+b)-(1-b)x]^2} \\ =& \frac{b^{\frac{m-3}{2}}}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \frac{(1-x^2)^{\frac{m-3}{2}}}{[(1+b)-(1-b)x]^{m-3}} \frac{2b}{[(1+b)-(1-b)x]^2} \\ =& \frac{2b^{\frac{m-1}{2}}}{\Beta(\frac{m-1}{2},\frac{m-1}{2})} \frac{(1-x^2)^{\frac{m-3}{2}}}{[(1+b)-(1-b)x]^{m-1}} \end{aligned}$ 这下一致了.

平均接受率

在拒绝采样法的简介中说: 平均接受率为 $\frac{1}{c}$ , 那么本拒绝采样法的平均接受率为 $\frac{1}{M}$ . $\begin{aligned} \frac{1}{M} = \frac{e(x_0, b_0)}{f(x_0, \kappa, m)} \end{aligned}$ 公式太过复杂, 简化无果后, 在 desmos 网站画出了其随 $\kappa, m$ 变化的图像(计算比较复杂,可能需要等一会儿图像才会出来):

可见, 接受率还是比较高的, 趋势大概是: $m$ 越大, 接受率越高, $\kappa$ 越大, 接受率越低. 但即使在 $\kappa=20$ 时, 接受率依然大于 $0.7$ .

下面给出了 $(m=50,\kappa=5)$ 和 $(m=5,\kappa=20)$ 时, $f_{radial}(x;\kappa,m)$ 和 $M*e(x, b_0)$ 的图像(前者为蓝色, 后者为黑色). 可见, 当 $(m=50,\kappa=5)$ 时, 两个图像几乎是重合的; 当 $(m=5,\kappa=20)$ 时, 两者出现了较大出入, 表现为接受率的下降.