必看！7天快速掌握python数据分析系列1【职场新人必备】

最新推荐文章于 2024-09-14 19:55:48 发布

快乐小多多

最新推荐文章于 2024-09-14 19:55:48 发布

阅读量629

点赞数 5

分类专栏： python数据分析文章标签： python 线性代数机器学习数据分析

本文链接：https://blog.csdn.net/weixin_49047177/article/details/119919267

版权

python数据分析专栏收录该内容

4 篇文章 0 订阅

订阅专栏

本文详细介绍了Python数据分析库NumPy的基础知识，包括数组对象ndarray的创建、变换、运算以及常用函数。通过实例展示了如何利用NumPy进行数据维度处理、类型转换、数组运算，并探讨了数据可视化在职业发展中的重要性。

摘要由CSDN通过智能技术生成

【python】数据分析——Numpy库入门（数据可视化必备，升职加薪~

文章目录

一、数据的维度

一维数据：列表和集合类型

[3.12, 3.14, 1.3124, 4.52]
{442.54, 5.52132, 6.414, 31.41}

二维数据：列表类型

[[3.12, 3.14, 1.3124, 4.52], [1.3123, 4.412, 41.43]]

多维数据：列表类型

二、NumPy的数组对象：ndarray

NumPy是一个开源的Python科学计算基础库，包含：
• 一个强大的N维数组对象 ndarray
• 广播功能函数
• 整合C/C++/Fortran代码的工具
• 线性代数、傅里叶变换、随机数生成等功能
NumPy是SciPy、Pandas等数据处理或科学计算库的基础

NumPy的引用

import numpy as np

np表示引入模块的别名
尽管别名可以省略或更改，建议使用上述约定的别名

np.array()生成一个ndarray数组

a=np.array([[0,1,2,3,4],
			[9,8,7,6,5]])
print(a)
#[[0,1,2,3,4],
# [9,8,7,6,5]]

轴(axis): 保存数据的维度；秩(rank)：轴的数量

a=np.array([[0,1,2,3,4],
			[9,8,7,6,5]])
print(a.ndim) # 2
print(a.shape) #(2,5)
print(a.size) #10
print(a.dtype) # dtype('int32')
print(a.itemsize) # 4

三、ndarray数组的元素类型

在这里插入图片描述

四、ndarray数组的创建方法

（1）从Python中的列表、元组等类型创建ndarray数组

x= np.array([1,2,3,4,5,6]) 
print(x)   #[1,2,3,4,5,6]
x= np.array((1,2,3,4,5,6)) 
print(x)   #(1,2,3,4,5,6)
x= np.array(list/tuple, dtype=np.float32)
#当np.array()不指定dtype时，NumPy将根据数据情况关联一个dtype类型
x= np.array([5,6],[3,4],(3,6)) 
print(x)   #[[5,6],[3,4],[3,6]]

（2）使用NumPy中函数创建ndarray数组，如：arange,ones, zeros等
np.arange(n) 类似range()函数，返回ndarray类型，元素从0到n‐1
np.ones(shape) 根据shape生成一个全
1数组，shape是元组类型
np.zeros(shape) 根据shape生成一个全
0数组，shape是元组类型
np.full(shape,val) 根据shape生成一个数组，每个元素值都是val
np.eye(n) 创建一个正方的n*n单位矩阵，对角线为
1，其余为0

import numpy as np
print(np.arange(10))
#[0 1 2 3 4 5 6 7 8 9]
print(np.ones((3,6)))
# [[1. 1. 1. 1. 1. 1.]
#  [1. 1. 1. 1. 1. 1.]
#  [1. 1. 1. 1. 1. 1.]]
print(np.zeros((4,5),dtype=np.int32))
# [[0 0 0 0 0]
#  [0 0 0 0 0]
#  [0 0 0 0 0]
#  [0 0 0 0 0]]
print(np.eye(5))
# [[1. 0. 0. 0. 0.]
#  [0. 1. 0. 0. 0.]
#  [0. 0. 1. 0. 0.]
#  [0. 0. 0. 1. 0.]
#  [0. 0. 0. 0. 1.]]

（3）使用NumPy中其他函数创建ndarray数组
np.linspace() 根据起止数据等间距地填充数据，形成数组
np.concatenate() 将两个或多个数组合并成一个新的数组

import numpy as np
a=np.linspace(1,5,2)
print(a)
#[1. 5.]
b=np.linspace(1,5,2,endpoint=False)
print(b)
#[1. 3.]
c=np.concatenate((a,b))
print(c)
#[1. 5. 1. 3.]

五、ndarray数组的变换

对于创建后的ndarray数组，可以对其进行维度变换和元素类型变换

（1）ndarray数组的维度变换

import numpy as np
a=np.ones((2,3,4))
print(a.reshape((3,8)))
# [[1. 1. 1. 1. 1. 1. 1. 1.]
#  [1. 1. 1. 1. 1. 1. 1. 1.]
#  [1. 1. 1. 1. 1. 1. 1. 1.]]

import numpy as np
a=np.ones((2,3,1))
print(a.flatten())
#[1. 1. 1. 1. 1. 1.]

（2）ndarray数组的类型变换

import numpy as np
a=np.ones((2,3,6))
print(a.astype(np.float))
# [[[1. 1. 1. 1. 1. 1.]
#   [1. 1. 1. 1. 1. 1.]
#   [1. 1. 1. 1. 1. 1.]]
# 
#  [[1. 1. 1. 1. 1. 1.]
#   [1. 1. 1. 1. 1. 1.]
#   [1. 1. 1. 1. 1. 1.]]]

（3）ndarray数组向列表的转换

import numpy as np
a = np.full((2,3,5),8)
print(a)
# [[[8 8 8 8 8]
#   [8 8 8 8 8]
#   [8 8 8 8 8]]
# 
#  [[8 8 8 8 8]
#   [8 8 8 8 8]
#   [8 8 8 8 8]]]
print(a.tolist())
#[[[8, 8, 8, 8, 8], [8, 8, 8, 8, 8], [8, 8, 8, 8, 8]], 
# [[8, 8, 8, 8, 8], [8, 8, 8, 8, 8], [8, 8, 8, 8, 8]]]

六、ndarray数组的操作

数组的索引与切片

import numpy as np
a = np.array([1,2,3,4,5])
print(a[2]) #3
print(a[1:4:2]) #[2,4]

b = np.arange(24).reshape((2,3,4))
print(b)
# [[[ 0  1  2  3]
#   [ 4  5  6  7]
#   [ 8  9 10 11]]
#
#  [[12 13 14 15]
#   [16 17 18 19]
#   [20 21 22 23]]]

print(b[1,2,3]) #23
print(b[0,1,2]) #6
print(b[-1,-2,-3]) #17

print(b[:,1,-3]) #[5,17]
print(b[:,1:3,:])
# [[[ 4  5  6  7]
#   [ 8  9 10 11]]
#
#  [[16 17 18 19]
#   [20 21 22 23]]]
print(b[:,:,::2])
# [[[ 0  2]
#   [ 4  6]
#   [ 8 10]]
#
#  [[12 14]
#   [16 18]
#   [20 22]]]

七、ndarray数组的运算

（1）数组与标量之间的运算作用于数组的每一个元素

import numpy as np
a = np.arange(24).reshape((2,3,4))
print(a)
# [[[ 0  1  2  3]
#   [ 4  5  6  7]
#   [ 8  9 10 11]]
# 
#  [[12 13 14 15]
#   [16 17 18 19]
#   [20 21 22 23]]]
print(a.mean())
#11.5
print(a/a.mean())
# [[[0.         0.08695652 0.17391304 0.26086957]
#   [0.34782609 0.43478261 0.52173913 0.60869565]
#   [0.69565217 0.7826087  0.86956522 0.95652174]]
# 
#  [[1.04347826 1.13043478 1.2173913  1.30434783]
#   [1.39130435 1.47826087 1.56521739 1.65217391]
#   [1.73913043 1.82608696 1.91304348 2.        ]]]

（2）NumPy一元函数
np.abs(x) np.fabs(x) 计算数组各元素的绝对值
np.sqrt(x) 计算数组各元素的平方根
np.square(x) 计算数组各元素的平方
np.log(x) np.log10(x)
np.log2(x) 计算数组各元素的自然对数、10底对数和
2底对数
np.ceil(x) np.floor(x) 计算数组各元素的ceiling值或 floor
值
np.rint(x) 计算数组各元素的四舍五入值
np.modf(x) 将数组各元素的小数和整数部分以两个独立数组形式返回
np.cos(x) np.cosh(x)
np.sin(x) np.sinh(x)
np.tan(x) np.tanh(x)
计算数组各元素的普通型和双曲型三角函数
np.exp(x) 计算数组各元素的指数值
np.sign(x) 计算数组各元素的符号值，1(+), 0, ‐1(
‐

import numpy as np
a = np.arange(24).reshape((2,3,4))
print(np.square(a))
# [[[  0   1   4   9]
#   [ 16  25  36  49]
#   [ 64  81 100 121]]
# 
#  [[144 169 196 225]
#   [256 289 324 361]
#   [400 441 484 529]]]
print(np.sqrt(a))
# [[[0.         1.         1.41421356 1.73205081]
#   [2.         2.23606798 2.44948974 2.64575131]
#   [2.82842712 3.         3.16227766 3.31662479]]
# 
#  [[3.46410162 3.60555128 3.74165739 3.87298335]
#   [4.         4.12310563 4.24264069 4.35889894]
#   [4.47213595 4.58257569 4.69041576 4.79583152]]]
print(np.modf(a))
# (array([[[0., 0., 0., 0.],
#         [0., 0., 0., 0.],
#         [0., 0., 0., 0.]],
# 
#        [[0., 0., 0., 0.],
#         [0., 0., 0., 0.],
#         [0., 0., 0., 0.]]]), array([[[ 0.,  1.,  2.,  3.],
#         [ 4.,  5.,  6.,  7.],
#         [ 8.,  9., 10., 11.]],
# 
#        [[12., 13., 14., 15.],
#         [16., 17., 18., 19.],
#         [20., 21., 22., 23.]]]))

（3）NumPy一元函数
+‐*/ ** 两个数组各元素进行对应运算
np.maximum(x,y) np.fmax()
np.minimum(x,y) np.fmin() 元素级的最大值/最小值计算
np.mod(x,y) 元素级的模运算
np.copysign(x,y) 将数组y中各元素值的符号赋值给数组x对应元素
< >= <= == != 算术比较，产生布尔型数组

import numpy as np
a = np.arange(24).reshape((2,3,4))
b = np.sqrt(a)
print(np.maximum(a,b))
# [[[ 0.  1.  2.  3.]
#   [ 4.  5.  6.  7.]
#   [ 8.  9. 10. 11.]]
# 
#  [[12. 13. 14. 15.]
#   [16. 17. 18. 19.]
#   [20. 21. 22. 23.]]]
print(a>b)
# [[[False False  True  True]
#   [ True  True  True  True]
#   [ True  True  True  True]]
# 
#  [[ True  True  True  True]
#   [ True  True  True  True]
#   [ True  True  True  True]]]