生成某一概率分布的数据

qq_30362711

已于 2023-08-28 09:02:25 修改

阅读量776

点赞数

分类专栏：概率文章标签：概率论

于 2021-10-14 11:34:35 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_30362711/article/details/120760408

版权

概率专栏收录该内容

3 篇文章 0 订阅

订阅专栏

简单的举例：

下图是高斯分布的概率密度函数曲线
在这里插入图片描述
可以见到中间的任意小区间的概率大于两边的小区间的概率。

要生成这个概率密度函数f(x)的数据
（1）以x轴等长的将定义域分解成很多小区间，如分解为100个区间。
（2)以同样概率随机的选一个小区间，利用f(x)的积分计算这个小区间的概率值
(3)取一个均值分布0-1随机一个数，若这个数小于刚刚计算的概率，那么就把这个数据留下来。否则就不留。
不断的重复就可以得到符合这个分布的X。

原理

以相同的概率选取X的值或X一个邻域。
因为选了一个邻域后，这个邻域有概率值，表示X取这个区间内的值的概率Pi。因此再选一个均匀分布Y，随机一个数，若这个数小于Pi，那么Pi这个点就通过了。
这样的话概率密度大的区间最后得到的点就会多，而概率密度小的点或区间得到的点就会少。

依照以上的原理可以得到公式：
在这里插入图片描述
Fx(x)是已知概率分布函数。任取一个x的值，若FX(x)的值大于一个均匀分布，那么就留下，这个思路和这个公式相符。假如这样取的话，这个分布就是目标分布。
又因为：

所以FX^-1(U)和X的分布一样。

参考

具体的数学分析可以看：
http://www3.eng.cam.ac.uk/~ss248/G12-M01/Week1/ITM.pdf

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
生成某一概率分布的数据

简单的举例：下图是高斯分布的概率密度函数曲线可以见到中间的任意小区间的概率大于两边的小区间的概率。要生成这个概率密度函数f(x)的数据，首先将区间分解成很多小区间，如分解为100个区间。然后同样概率随机的选一个小区间，这个小区间的概率用f(x)的积分来算。接下来取一个均值分布0-1随机一个数。若这个数大于小区间的概率，那么就把这个数据留下来。否则就不留。不断的重复就可以得到符合这个分布的X。原理以相同的概率选取X的值或X一个邻域。因为选了一个邻域后，这个邻域有概率值，表示X取这个区间内的
复制链接

扫一扫

专栏目录

qq_30362711 CSDN认证博客专家 CSDN认证企业博客

码龄9年

116: 原创

6万+: 周排名

37万+: 总排名

10万+: 访问

: 等级

2103: 积分

41: 粉丝

49: 获赞

24: 评论

176: 收藏

私信

关注

热门文章

分类专栏

最新评论

pca与ica学习与理解
CSDN-Ada助手: 哇, 你的文章质量真不错，值得学习！不过这么高质量的文章, 还值得进一步提升, 以下的改进点你可以参考下: (1)增加条理清晰的目录；(2)提升标题与正文的相关性；(3)使用更多的站内链接。
生成某一概率分布的数据
lyj0913111: 0.99最多？
现代颜色技术原理及应用学习记录
CRFX: https://pan.baidu.com/s/1aajv5Gq
imagenet 数据集读取数据速度记录
weixin_43436587: 你好请教一下， imagenet整个数据集读取的时候非常慢，但是，如果取出来imagenet的一小部分，就读取的特别快，只是数据集变小了，bs则，线程数等所有其他的都没有变，这还少为什么呢？求指教。
A Tutorial on Energy-Based Learning（机器学习能量模型）学习记录
苦乐多儿: 谢谢

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。