一、基本用法
它用于从给定数组或序列中进行随机采样。
下面介绍了两种的基本用法:
import numpy as np
# 创建值的数组或序列
data = np.array([1, 2, 3, 4, 5])
# 从数组中随机选择一个元素
random_element = np.random.choice(data)
print(random_element)
# 您还可以指定要绘制的随机样本的数量
random_elements = np.random.choice(data, size=3)
print(random_elements)
在上面的示例中,np.random.choice
用于从data
数组中随机选择元素。默认情况下,它选择一个元素,但您可以使用参数指定所需的样本数size
。
以下是一些常用参数np.random.choice
:
a
:要从中采样的输入数组或序列。size
:要抽取的样本数。如果未指定,则默认为 1。replace
:如果True
,则通过放回进行采样(可以多次选择相同的元素)。如果False
,则采样无需放回。p
:输入数组中每个元素的可选概率分布。如果指定,它确定每个元素被选择的概率。
np.random.choice
常用于各种应用,包括机器学习中数据增强的随机采样、统计中的引导以及创建随机排列。
二、举例在mini-batch的实现中的一段代码
import numpy as np
train_size = 60000
batch_size = 100
# 获取mini-batch
batch_mask = np.random.choice(60000, 100)
print(batch_mask)
这里,
mini-batch
的大小为
100
,需要每次从
60000
个训练数据中随机取出100
个数据(图像数据和正确解标签数据)。