numpy学习笔记二：随机抽样

最新推荐文章于 2024-07-12 14:44:29 发布

阿耀、Radio

最新推荐文章于 2024-07-12 14:44:29 发布

阅读量1.2k

点赞数

分类专栏：学习笔记文章标签： python numpy

本文链接：https://blog.csdn.net/weixin_48094385/article/details/110143812

版权

这篇博客详细介绍了numpy库在随机抽样中的应用，包括二项分布、泊松分布、超几何分布、均匀分布和正态分布的实例解析，以及随机函数如choice和shuffle的使用方法，帮助读者深入理解numpy的随机数生成与分布概念。

摘要由CSDN通过智能技术生成

一、离散型随机变量
1、二项分布
【例】野外正在进行9（n=9）口石油勘探井的发掘工作，每一口井能够开发出油的概率是0.1（p=0.1）。请问，最终所有的勘探井都勘探失败的概率？
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

np.random.seed(20200605)
n = 9# 做某件事情的次数
p = 0.1# 做某件事情成功的概率
size = 50000
x = np.random.binomial(n, p, size)
‘’‘或者使用binom.rvs
#使用binom.rvs(n, p, size=1)函数模拟一个二项随机变量,可视化地表现概率
y = stats.binom.rvs(n, p, size=size)#返回一个numpy.ndarray
‘’’
print(np.sum(x == 0) / size) # 0.3897

plt.hist(x)
plt.xlabel(‘随机变量：成功次数’)
plt.ylabel(‘样本中出现的次数’)
plt.show()
#它返回一个列表，列表中每个元素表示随机变量中对应值的概率
s = stats.binom.pmf(range(10), n, p)
print(np.around(s, 3))

[0.387 0.387 0.172 0.045 0.007 0.001 0. 0. 0. 0. ]

在这里插入图片描述
【例】模拟投硬币，投2次，请问两次都为正面的概率？
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt

np.random.seed(20200605)
n = 2# 做某件事情的次数,这里是投两次硬币
p = 0.5#做某件事情成功的概率，在这里即投硬币为正面的概率
size = 50000
x = np.random.binomial(n, p, size)
‘’‘或者使用binom.rvs
#使用binom.rvs(n, p, size=1)函数模拟一个二项随机变量,可视化地表现概率
y = stats.binom.rvs(n, p, size=size)#返回一个numpy.ndarray
‘’’
print(np.sum(x == 0) / size) # 0.25154
print(np.sum(x == 1) / size) # 0.49874
print(np.sum(x == 2) / size) # 0.24972

plt.hist(x, density=True)
plt.xlabel(‘随机变量：硬币为正面次数’)
plt.ylabel(‘50000个样本中出现的次数’)
plt.show()
#它返回一个列表，列表中每个元素表示随机变量中对应值的概率
s = stats.binom.pmf(range(n + 1), n, p)
print(np.around(s, 3))

[0.25 0.5 0.25]

在这里插入图片描述
2、泊松分布
【例】假定某航空公司预定票处平均每小时接到42次订票电话，那么10分钟内恰好接到6次电话的概率是多少？
import numpy as np
from scipy import stats
import matplotlib.pyplot as plt

np.random.seed(20200605)
lam = 42 / 6# 平均值：平均每十分钟接到42/6次订票电话
size = 50000
x = np.random.poisson(lam, size)
‘’‘或者
#模拟服从泊松分布的50000个随机变量
x = stats.poisson.rvs(lam,size=size)
‘’’
print(np.sum(x == 6) / size) # 0.14988

plt.hist(x)
plt.xlabel(‘随机变量：每十分钟接到订票电话的次数’)
plt.ylabel(