如何产生满足高斯分布的随机数据

问题

  • 假设随机变量z服从标准正态分布 N ( 0 , 1 ) N(0,1) N(0,1) , X = δ z + μ X = \delta z + \mu X=δz+μ。则 X X X服从均值为 μ \mu μ,方差为 δ \delta δ的高斯分布 N ( μ , δ 2 ) N(\mu,\delta^2) N(μ,δ2)

采样方法

  • 常见的采样方法有逆变换法、拒绝采样法 、重要性采样及其重采样、马尔科夫蒙特卡洛采样法等。那么高斯分布如何采样?

逆变换法

1. 直接用逆变换法

没有显式解,计算麻烦,且需要求逆。

2. Box-Muller算法
二维情况:

  • 假设x, y是两个服从标准正态分布的独立随机变量,在圆盘上满足高斯分布。得到符合标准正态分布(x,y)的采样过程为:
    1. 产生[0,1]上的两个独立的均匀分布随机数 u 1 , u 2 u_1 , u_2 u1,u2
    2. x = − 2 l n ( u 1 ) c o s 2 π u 2 x = \sqrt{-2ln(u_1)}cos2\pi u_2 x=2ln(u1) cos2πu2
      y = − 2 l n ( u 1 ) s i n 2 π u 2 y = \sqrt{-2ln(u_1)}sin2\pi u_2 y=2ln(u1) sin2πu2
  • x , y x,y xy服从标准正态分布,并且是独立的。

3. Marsaglia polar method算法

  • Box-Muller算法需要计算三角函数,相对还是比较耗时。Marsaglia polar method算法 避开了其中的三角函数的计算,速度更快。其采样过程为:
  • 二维情况:
    1. 用拒绝采样法,产生均匀分布随机数对
    2. s = x 2 + y 2 s=x^2+y^2 s=x2+y2,则 x 2 − l n s s x\sqrt{ \frac{2-lns}{s} } xs2lns y 2 − l n s s y\sqrt{ \frac{2-lns}{s} } ys2lns 是服从标准真来分布的样本。用 x s \frac{x}{\sqrt{s}} s x y s \frac{y}{\sqrt{s}} s y来代替cos和sin计算。

拒绝采样法

  • 见参考文献。

代码

代码

参考文献

Hulu机器学习问题与解答系列 | 十四:如何对高斯分布进行采样
一维正态分布随机数序列产生的方法

  • 4
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
### 回答1: 非广义高斯分布是一种用来描述拥有不同参数的概率分布的一种统计方法。它基于高斯分布,但是它的假设是参数是可以自由调整的,从而让它更加灵活。非广义高斯分布的主要优点是可以描述出更复杂的模型,从而更好地拟合实际的数据。 ### 回答2: 非广义高斯分布是指不满足高斯分布的统计分布。在正态分布的基础上,我们通常认为其具有对称的钟形曲线特征,但在现实中存在着一些违背高斯分布的情况。 非广义高斯分布的特点可以包括以下几个方面: 1. 长尾分布:与高斯分布相比,非广义高斯分布通常具有更加重的尾部,尾部的概率密度逐渐递减,而不是呈现标准正态分布下的快速衰减。 2. 偏态分布:非广义高斯分布可能呈现明显的偏态,即分布的中心不在平均值附近,而是向一个特定方向偏离。 3. 异常值扩散:与高斯分布相比,非广义高斯分布更容易生成一些极端的异常值,这些异常值不太符合正态分布的规律。 4. 多峰分布:广义高斯分布通常只有一个明显的峰值,而非广义高斯分布可能得到多个峰值,即存在多个分布密度的高峰。 非广义高斯分布在实际中广泛存在,例如金融市场中的股票收益率分布、自然界中的物种分布以及网络中信息传播的规律等。这些分布常常呈现出更复杂的形态,往往不能简单地通过正态分布进行描述和建模。 非广义高斯分布的研究对于理解复杂系统的行为具有重要意义,它提供了一种更加灵活的统计模型选择,能够更准确地表达实际情况。因此,非广义高斯分布的研究不仅对于统计学和概率论的发展有着重要的意义,也对于应用领域的决策分析和风险管理具有重要价值。 ### 回答3: 非广义高斯分布是指在高斯分布的基础上,通过引入一些修正因素或变形操作,使得分布具有额外的性质或特征。非广义高斯分布可以用于更灵活地对数据进行建模和分析。 一种常见的非广义高斯分布是指数分布,它是指数函数的形状。指数分布具有单峰、右偏、非负的特点,常用于描述等待时间、寿命分布等随机现象。 另一个常见的非广义高斯分布是对数正态分布,它是指数函数的对数形状。对数正态分布具有右偏、非负的特点,适用于描述正数且具有指数增长或衰减的现象,例如金融领域中的资产收益率、生物学中的细胞增长率等。 除此之外,广义高斯分布还包括截尾正态分布、混合高斯分布等等。截尾正态分布是一种在高斯分布上进行截尾操作,将分布限制在一定范围内的分布。混合高斯分布是将多个高斯分布进行线性组合而成的分布,其形状可以更加灵活地适应不同的数据。 非广义高斯分布具有较大的灵活性,可以更好地适应不同类型的数据。在实际应用中,可以根据数据特性选择合适的非广义高斯分布来对数据进行建模和分析,从而获得更准确的结果。不同的非广义高斯分布适用于不同的领域和问题,选择合适的分布要根据具体情况进行判断。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值