假设我们的数据都在数组中,并且数组中的数据是一些存在重复的人名。我们先使用numpy.random中的randn函数来生成一些随机正态分布的数据:
import numpy as np
names = np.array(['Bob','Joe','Will','Bob','Will','Joe','Joe'])
data = np.random.randn(7,4)
names
array(['Bob', 'Joe', 'Will', 'Bob', 'Will', 'Joe', 'Joe'], dtype='<U4')
data
array([[-0.24427644, -1.46367872, -0.49068242, 1.78822424],
[-0.86311703, 0.51422326, 0.56743326, 0.8871636 ],
[-0.5866742 , 0.73856216, 0.38637554, 0.30568998],
[ 0.57535788, 1.30374594, -2.05887936, -0.22818597],
[ 2.35235075, 0.68025456, 1.00348864, 0.32746915],
[ 0.42857695, -0.16228046, 1.27368772, -0.648772 ],
[ 0.00398702, 0.72742387, -0.79640429, -0.93247884]])
假设每个人名都和data数组中的一行相对应,