Numpy模块学习
一、ndim、shape、dtype、astype
- ndim
ndim返回的是数组的维度,返回的只有一个数,该数即表示数组的维度
2.shape
shape:表示各位维度大小的元组。返回的是一个元组。
对于一维数组:有疑问的是为什么不是(1,6),因为arr1.ndim维度为1,元组内只返回一个数。
对于二维数组:前面的是行,后面的是列,他的ndim为2,所以返回两个数。
对于三维数组:很难看出,下面打印arr3,看下它是什么结构
先看最外面的中括号,包含[[1,2,3],[4,5,6]]和[[7,8,9],[10,11,12]],假设他们为数组A、B,就得到[A,B],如果A、B仅仅是一个数字,他的ndim
就是2,这就是第一个数。但是A、B是(2,3)的数组。所以结合起来,这就是arr3的shape,为(2,2,3)。
将这种方法类比,也就可以推出4维、5维数组的shape。
- List item
dtype:一个用于说明数组数据类型的对象。返回的是该数组的数据类型。由于图中的数据都为整形,所以返回的都是int32。如果数组中有数据带有小数点,那么就会返回float64。
有疑问的是:整形数据不应该是int吗?浮点型数据不应该是float吗?
解答:int32、float64是Numpy库自己的一套数据类型
- astype
astype:转换数组的数据类型。
int32 --> float64 完全ojbk
float64 --> int32 会将小数部分截断
string_ --> float64 如果字符串数组表示的全是数字,也可以用astype转化为数值类型
注意其中的float,它是python内置的类型,但是Numpy可以使用。Numpy会将Python类型映射到等价的dtype上
转自https://blog.csdn.net/a1809032425/article/details/82316672
- reshape
data.values.reshape(-1,1)
z.reshape(-1, 2)
转自https://blog.csdn.net/u010472858/article/details/95257703
二、
np.nonzero函数是numpy中用于得到数组array中非零元素的位置(数组索引)的函数
nonzero(a)
返回数组a中非零元素的索引值数组。
(1)只有a中非零元素才会有索引值,那些零值元素没有索引值;
(2)返回的索引值数组是一个2维tuple数组,该tuple数组中包含一维的array数组。其中,一维array向量的个数与a的维数是一致的。
(3)索引值数组的每一个array均是从一个维度上来描述其索引值。比如,如果a是一个二维数组,则索引值数组有两个array,第一个array从行维度来描述索引值;第二个array从列维度来描述索引值。
(4) 该np.transpose(np.nonzero(x))
函数能够描述出每一个非零元素在不同维度的索引值。
(5)通过a[nonzero(a)]得到所有a中的非零值
#a是1维数组
a = [0,2,3]
b = np.nonzero(a)
print(np.array(b).ndim)
print(b)
结果:
2
(array([1, 2], dtype=int64),)
说明:索引1和索引2的位置上元素的值非零。
#a是2维数组
a = np.array([[0,0,3],[0,0,0],[0,0,9]])
b = np.nonzero(a)
print(np.array(b).ndim)
print(b)
print(np.transpose(np.nonzero(a)))
结果:
2
(array([0, 2], dtype=int64), array([2, 2], dtype=int64))
[[0 2]
[2 2]]
说明:
(1)a中有2个非零元素,因此,索引值tuple中array的长度为2。因为,只有非零元素才有索引值。
(2)索引值数组是2 维的。实际上,无论a的维度是多少,索引值数组一定是2维的tuple,但是tuple中的一维array个数和a的维数一致。
(3)第1个array([0, 2])是从row值上对3和9进行的描述
。第2个array([2, 2])是从col值上对3和9的描述。这样,从行和列上两个维度上各用一个数组来描述非零索引值。
(4)通过调用np.transpose()函数,得出3的索引值是[0 2]
,即第0行,第2列。
#a是3维数组
a = np.array([[[0,1],[1,0]],[[0,1],[1,0]],[[0,0],[1,0]]])
b = np.nonzero(a)
print(np.array(b).ndim)
print(b)
结果:
2
(array([0, 0, 1, 1, 2], dtype=int64), array([0, 1, 0, 1, 1], dtype=int64), array([1, 0, 1, 0, 0], dtype=int64))
说明:由于a是3维数组,因此,索引值数组有3个一维数组。
print(a)
[[[0 1]
[1 0]]
[[0 1]
[1 0]]
[[0 0]
[1 0]]]
a的数组结构如上所示,请将a想像为数量为3的一组小图片,每张图片的大小为2*2,下文中以num * row * col来分别表示其维度。
b包含3个长度为5的array,这意味着a有3维,且a共有5个非0值。
先说b中的第1个向量是[0, 0, 1, 1, 2],这实际是a在num维度上描述的非零值。第0张图上有2个非零值,第1张图上有2个非零值,第2张图上有1个非零值。因此在num维度上的非零值数组为[0, 0, 1, 1, 2]。
b中的第2个向量是[0, 1, 0, 1, 1],这实际是a在row维度上描述的非零值。由于row上的值只有0和1(只2行),所以只由0和1组成。
b中的第3个向量,聪明的读者可能已经明白,不再赘述。
## 三、random.randn()
numpy.random.rand(d0,d1,…,dn)
rand函数根据给定维度生成[0,1)之间的数据,包含0,不包含1
dn表格每个维度
返回值为指定维度的array
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191117160256567.png)
## 四、数组的布尔型索引
In [15]: languages = np.array(['c','perl','python','c','python','perl','java'])
In [17]: languages == 'java'
Out[17]: array([False, False, False, False, False, False, True], dtype=bool)
In [19]: data
array([[ 0.53269771, -0.96777826, 0.16436322, -0.66330618, -1.51764433],
[-0.21901685, -1.40160172, -1.53372728, 1.34650319, 0.15598243],
[-0.69165371, -2.54222671, -3.21942188, -0.79798456, -0.27872961],
[-0.5463104 , 0.05802836, 0.31547985, -0.72454312, 1.78765555],
[-0.75535754, 0.31312654, 0.8220388 , 0.70390257, 1.01196357],
[ 1.21271695, -0.22248861, -0.10805819, 1.35481495, 0.48239976],
[ 0.49911817, 0.44448865, -0.07650099, 0.52474671, -0.5468977 ]])
In [22]: data[languages == 'python']
Out[22]:
array([[-0.69165371, -2.54222671, -3.21942188, -0.79798456, -0.27872961],
[-0.75535754, 0.31312654, 0.8220388 , 0.70390257, 1.01196357]])