【Python】Numpy模块学习_dtype=int64-CSDN博客

Numpy模块学习

一、ndim、shape、dtype、astype

ndim

ndim返回的是数组的维度，返回的只有一个数，该数即表示数组的维度

2.shape
在这里插入图片描述
shape：表示各位维度大小的元组。返回的是一个元组。

对于一维数组：有疑问的是为什么不是（1，6），因为arr1.ndim维度为1，元组内只返回一个数。

对于二维数组：前面的是行，后面的是列，他的ndim为2，所以返回两个数。

对于三维数组：很难看出，下面打印arr3，看下它是什么结构
在这里插入图片描述
先看最外面的中括号，包含[[1,2,3],[4,5,6]]和[[7,8,9],[10,11,12]]，假设他们为数组A、B，就得到[A,B]，如果A、B仅仅是一个数字，他的ndim

就是2，这就是第一个数。但是A、B是（2，3）的数组。所以结合起来，这就是arr3的shape，为（2，2，3）。

将这种方法类比，也就可以推出4维、5维数组的shape。

List item
dtype：一个用于说明数组数据类型的对象。返回的是该数组的数据类型。由于图中的数据都为整形，所以返回的都是int32。如果数组中有数据带有小数点，那么就会返回float64。

有疑问的是：整形数据不应该是int吗？浮点型数据不应该是float吗？

解答：int32、float64是Numpy库自己的一套数据类型

astype

astype：转换数组的数据类型。

int32 --> float64 完全ojbk

float64 --> int32 会将小数部分截断

string_ --> float64 如果字符串数组表示的全是数字，也可以用astype转化为数值类型

注意其中的float，它是python内置的类型，但是Numpy可以使用。Numpy会将Python类型映射到等价的dtype上

转自https://blog.csdn.net/a1809032425/article/details/82316672

reshape
data.values.reshape(-1,1)

z.reshape(-1, 2)

转自https://blog.csdn.net/u010472858/article/details/95257703

二、

np.nonzero函数是numpy中用于得到数组array中非零元素的位置（数组索引）的函数

nonzero(a)

返回数组a中非零元素的索引值数组。

（1）只有a中非零元素才会有索引值，那些零值元素没有索引值；
（2）返回的索引值数组是一个2维tuple数组，该tuple数组中包含一维的array数组。其中，一维array向量的个数与a的维数是一致的。
（3）索引值数组的每一个array均是从一个维度上来描述其索引值。比如，如果a是一个二维数组，则索引值数组有两个array，第一个array从行维度来描述索引值；第二个array从列维度来描述索引值。
（4）该np.transpose(np.nonzero(x))
函数能够描述出每一个非零元素在不同维度的索引值。
（5）通过a[nonzero(a)]得到所有a中的非零值

#a是1维数组
a = [0,2,3]
b = np.nonzero(a)
print(np.array(b).ndim)
print(b)
 
结果：
2
(array([1, 2], dtype=int64),)
说明：索引1和索引2的位置上元素的值非零。
 
#a是2维数组
a = np.array([[0,0,3],[0,0,0],[0,0,9]])
b = np.nonzero(a)
print(np.array(b).ndim)
print(b)
print(np.transpose(np.nonzero(a)))
结果：
2
(array([0, 2], dtype=int64), array([2, 2], dtype=int64))
[[0 2]
 [2 2]]
说明：
（1）a中有2个非零元素，因此，索引值tuple中array的长度为2。因为，只有非零元素才有索引值。
（2）索引值数组是2 维的。实际上，无论a的维度是多少，索引值数组一定是2维的tuple，但是tuple中的一维array个数和a的维数一致。
（3）第1个array([0, 2])是从row值上对3和9进行的描述
。第2个array([2, 2])是从col值上对3和9的描述。这样，从行和列上两个维度上各用一个数组来描述非零索引值。
（4）通过调用np.transpose()函数，得出3的索引值是[0 2]
，即第0行，第2列。
 
 
#a是3维数组
a = np.array([[[0,1],[1,0]],[[0,1],[1,0]],[[0,0],[1,0]]])
b = np.nonzero(a)
print(np.array(b).ndim)
print(b)
结果：
2
(array([0, 0, 1, 1, 2], dtype=int64), array([0, 1, 0, 1, 1], dtype=int64), array([1, 0, 1, 0, 0], dtype=int64))
说明：由于a是3维数组，因此，索引值数组有3个一维数组。
print(a)
[[[0 1]
  [1 0]]
 
 [[0 1]
  [1 0]]
 
 [[0 0]
  [1 0]]]
  a的数组结构如上所示，请将a想像为数量为3的一组小图片，每张图片的大小为2*2，下文中以num * row * col来分别表示其维度。
  b包含3个长度为5的array，这意味着a有3维，且a共有5个非0值。
  先说b中的第1个向量是[0, 0, 1, 1, 2]，这实际是a在num维度上描述的非零值。第0张图上有2个非零值，第1张图上有2个非零值，第2张图上有1个非零值。因此在num维度上的非零值数组为[0, 0, 1, 1, 2]。
  b中的第2个向量是[0, 1, 0, 1, 1]，这实际是a在row维度上描述的非零值。由于row上的值只有0和1（只2行），所以只由0和1组成。
  b中的第3个向量，聪明的读者可能已经明白，不再赘述。

## 三、random.randn()
numpy.random.rand(d0,d1,…,dn)
rand函数根据给定维度生成[0,1)之间的数据，包含0，不包含1
dn表格每个维度
返回值为指定维度的array
![在这里插入图片描述](https://img-blog.csdnimg.cn/20191117160256567.png)

## 四、数组的布尔型索引
In [15]: languages = np.array(['c','perl','python','c','python','perl','java'])
In [17]: languages == 'java'
Out[17]: array([False, False, False, False, False, False,  True], dtype=bool)

In [19]: data
array([[ 0.53269771, -0.96777826,  0.16436322, -0.66330618, -1.51764433],
       [-0.21901685, -1.40160172, -1.53372728,  1.34650319,  0.15598243],
       [-0.69165371, -2.54222671, -3.21942188, -0.79798456, -0.27872961],
       [-0.5463104 ,  0.05802836,  0.31547985, -0.72454312,  1.78765555],
       [-0.75535754,  0.31312654,  0.8220388 ,  0.70390257,  1.01196357],
       [ 1.21271695, -0.22248861, -0.10805819,  1.35481495,  0.48239976],
       [ 0.49911817,  0.44448865, -0.07650099,  0.52474671, -0.5468977 ]])


In [22]: data[languages == 'python']
Out[22]:
array([[-0.69165371, -2.54222671, -3.21942188, -0.79798456, -0.27872961],
       [-0.75535754,  0.31312654,  0.8220388 ,  0.70390257,  1.01196357]])