当我第一次用python来处理数据的时候,深深被它的强大所折服,虽然我是才开始接触数据分析领域并且没有接触到其他的数据分析工具,我依然觉得python的numpy以及pandas库非常的强大,在看书时看到了对于numpy的一些分析觉得说的很好,于是就给大家分享一下.
以下内容来自于<<利用python进行数据分析>>
布尔型索引:
这个例子讲的非常好容易弄懂
首先我们假设有一个用于储存数据的数组以及一个储存姓名的数组(含有重复项)
>>>import numpy as np
>>>from numpy.random import randn #用来生成一些正太分布的随机数据
>>>names=np.array(['Bob','Joe','Jhon','Will','Bob','Joe','Joe']) #储存姓名的数组
>>>data=randn(7,4) #生成含随机值的数组
>>>data
array([[ 0.74909714, -2.10128795, -0.83747237, 0.35225215],
[ 1.87529168, -1.10946713, -0.36132735, 0.51756533],
[-1.07328408, -0.39283394, 1.51971707, 1.2427