在神经网络中,经常会用到批量样本训练。我们需要从数组随机取数据,主要有以下几种方法:
1、np.random.shuffle:将原数组打乱
import numpy as np
array = np.random.randint(1,100,size=10)
#[63 32 80 33 61 45 28 55 39 80]
batch_size=5
print(array[0:batch_size])
#[63 32 80 33 61]
np.random.shuffle(rand_arr)
print(array[0:batch_size])
#[33 45 80 28 55]
#另一种写法
# rand_arr = np.arange(array.shape[0])
# np.random.shuffle(rand_arr)
# print(array[rand_arr[0:batch_size]])
# np.random.shuffle(rand_arr)
# print(array[rand_arr[0:5]])
2、np.random.choice:生成乱序的序号,从数据中取出(不改变原始序列)
import numpy as np
array = np.random.randint(1,100,size=10)
#[63 32 80 33 61 45 28 55 39 80]
batch_size=5
slice=np.random.choice(array.shape[0],batch_size)
print(array[slice])
这种方法其实就是生成输定数量的在某个范围内的随机数:
1、随机取多个数,random.randint()的函数原型为:random.randint(a, b),用于生成一个指定范围内的整数。
import random
[random.randint(0,100) for _ in range(10)]
2、在固定列表中随机去多个数,random.sample的函数原型为:random.sample(sequence, k),从指定序列中随机获取指定长度的片断。(这里的适用对象是列表类型的数据)
a=[0,1,2,3,4,5,6,7,8,9]
random.sample(a, 5)