numpy组队学习——随机抽样

最新推荐文章于 2024-08-06 17:20:59 发布

一只丁小丁呐

最新推荐文章于 2024-08-06 17:20:59 发布

阅读量289

点赞数

分类专栏： Datawhale组队学习——Numpy入门 Datawhale组队学习——Numpy 文章标签： numpy python

本文链接：https://blog.csdn.net/weixin_45739042/article/details/110097450

版权

Datawhale组队学习——Numpy入门同时被 2 个专栏收录

1 篇文章 0 订阅

订阅专栏

Datawhale组队学习——Numpy

1 篇文章 0 订阅

订阅专栏

本文介绍了numpy.random模块在Python中的应用，重点讲解了如何使用numpy.random.seed设定随机种子，确保可重复性。此外，详细阐述了离散型随机变量中的二项分布，举例说明了二项分布的概率计算及numpy.random.binomial函数的使用，通过实例计算了石油勘探井失败概率和投硬币正面向上的概率，并展示了概率分布的可视化。

摘要由CSDN通过智能技术生成

1、概述

numpy.random 模块对 Python 内置的 random 进行了补充，增加了一些用于高效生成多种概率分布的样本值的函数，如正态分布、泊松分布等。

numpy.random.seed(seed=None)

seed()用于指定随机数生成时所用算法开始的整数值，如果使用相同的seed()值，则每次生成的随机数都相同，如果不设置这个值，则系统根据时间来自己选择这个值，此时每次生成的随机数因时间差异而不同。

在对数据进行预处理时，经常加入新的操作或改变处理策略，此时如果伴随着随机操作，最好还是指定唯一的随机种子，避免由于随机的差异对结果产生影响。

2、离散型随机变量

2.1 二项分布

二项分布可以用于只有一次实验只有两种结果，各结果对应的概率相等的多次实验的概率问题。比如处理猜10次拳赢6次的概率等类似的问题。

二项分布概率函数的代码表示：

binom.pmf(k) = choose(n, k) p**k (1-p)**(n-k)

二项分布概率函数的数学表示：
在这里插入图片描述

numpy.random.binomial(n, p, size=None)

表示对一个二项分布进行采样，size表示采样的次数，n表示做了n重伯努利试验，p表示成功的概率，函数的返回值表示n中成功的次数。

例1：野外正在进行9（n=9）口石油勘探井的发掘工作，每一口井能够开发出油的概率是0.1（p=0.1）。请问，最终所有的勘探井都勘探失败的概率？

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats

np.random.seed(20200605)
n = 9# 做某件事情的次数
p = 0.1# 做某件事情成功的概率
size = 50000
x = np.random.binomial(n, p, size)
'''或者使用binom.rvs
#使用binom.rvs(n, p, size=1)函数模拟一个二项随机变量,可视化地表现概率
y = stats.binom.rvs(n, p, size=size)#返回一个numpy.ndarray
'''
print(np.sum(x == 0) / size)  # 0.3897

plt.hist(x)
plt.xlabel('随机变量：成功次数')
plt.ylabel('样本中出现的次数')
plt.show()
#它返回一个列表，列表中每个元素表示随机变量中对应值的概率
s = stats.binom.pmf(range(10), n, p)
print(np.around(s, 3))
# [0.387 0.387 0.172 0.045 0.007 0.001 0.    0.    0.    0.   ]

例2：模拟投硬币，投两次，请问两次都为正面的概率？

import numpy as np
from scipy import stats
import matplotlib.pyplot as plt

np.random.seed(20200605)
n = 2# 做某件事情的次数,这里是投两次硬币
p = 0.5#做某件事情成功的概率，在这里即投硬币为正面的概率
size = 50000
x = np.random.binomial(n, p, size)
'''或者使用binom.rvs
#使用binom.rvs(n, p, size=1)函数模拟一个二项随机变量,可视化地表现概率
y = stats.binom.rvs(n, p, size=size)#返回一个numpy.ndarray
'''
print(np.sum(x == 0) / size)  # 0.25154
print(np.sum(x == 1) / size)  # 0.49874
print(np.sum(x == 2) / size)  # 0.24972

plt.hist(x)
plt.xlabel('随机变量：硬币为正面次数')
plt.ylabel('50000个样本中出现的次数')
plt.show()
#它返回一个列表，列表中每个元素表示随机变量中对应值的概率
s = stats.binom.pmf(range(n + 1), n, p)
print(np.around(s, 3))

分割线明天继续
——————————————————————————

一只丁小丁呐

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
numpy组队学习——随机抽样

numpy组队学习——随机抽样1、概述2、离散型随机变量2.1 二项分布1、概述numpy.random 模块对 Python 内置的 random 进行了补充，增加了一些用于高效生成多种概率分布的样本值的函数，如正态分布、泊松分布等。numpy.random.seed(seed=None) seed()用于指定随机数生成时所用算法开始的整数值，如果使用相同的seed()值，则每次生成的随机数都相同，如果不设置这个值，则系统根据时间来自己选择这个值，此时每次生成的随机数因时间差异而不同。在对数据
复制链接

扫一扫

专栏目录