Python列表和Numpy数组的区别:
Numpy使用ndarray对象来处理多维数组,该对象是一个快速而灵活的大数据容器。使用Python列表可以存储一维数组,通过列表的嵌套可以实现多维数组,那么为什么还需要使用Numpy呢?Numpy是专门针对数组的操作和运算进行了设计,所以数组的存储效率和输入输出性能远优于Python中的嵌套列表,数组越大,Numpy的优势就越明显。通常Numpy数组中的所有元素的类型都是相同的,而Python列表中的元素类型是任意的,所以在通用性能方面Numpy数组不及Python列表,但在科学计算中,可以省掉很多循环语句,代码使用方面比Python列表简单的多。
能用array的尽量用array,迫不得已要用matrix的,最后再转换为array!
两个重要转换函数:
- np.asarray():转换为数组
- np.matrix():转换为矩阵
Numpy数组和矩阵的区别:
- Numpy matrix必须是2维的,但是 numpy arrays (ndarrays) 可以是多维的(1D,2D,3D····ND). Matrix是Array的一个小的分支,包含于Array。所以matrix 拥有array的所有特性。
- 在numpy中matrix的主要优势是:相对简单的乘法运算符号。例如,a和b是两个matrices,那么a*b,就是矩阵积。
- matrix 和 array 都可以通过objects后面加.T 得到其转置。 但是 matrix objects 还可以在后面加 .H f得到共轭矩阵, 加 .I 得到逆矩阵。
- 相反的是在numpy里面arrays遵从逐个元素的运算,所以array:c 和d的c*d运算相当于matlab里面的c.*d运算。而矩阵相乘,则需要numpy里面的dot命令 。
正是由于matrix必须是二维的,当只有一个元素时(例如:1)matrix下的shape=(1,1)而array下的shape=(1,)
x = np.matrix(np.arange(12).reshape((3,4))); x
Out[23]:
matrix([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
y=np.asarray(x)
y
Out[25]:
array([[ 0, 1, 2, 3],
[ 4, 5, 6, 7],
[ 8, 9, 10, 11]])
x[0]
Out[26]: matrix([[0, 1, 2, 3]])
y[0]
Out[27]: array([0, 1, 2, 3])
x[0][1] #矩阵情况下报错
Traceback (most recent call last):
File "A:\anaconda3\lib\site-packages\IPython\core\interactiveshell.py", line 3418, in run_code
exec(code_obj, self.user_global_ns, self.user_ns)
File "<ipython-input-28-9bcfb00c9414>", line 1, in <module>
x[0][1]
File "A:\anaconda3\lib\site-packages\numpy\matrixlib\defmatrix.py", line 193, in __getitem__
out = N.ndarray.__getitem__(self, index)
IndexError: index 1 is out of bounds for axis 0 with size 1
y[0][1] #矩阵情况下未报错
Out[29]: 1
x[0].shape
Out[30]: (1, 4)
y[0].shape
Out[31]: (4,)
在做归约运算时,array的维数会发生变化,但matrix总是保持为2维。