数据分析（3）python科学计算：用NumPy快速处理数据

最新推荐文章于 2024-07-15 23:43:23 发布

大白羊的进阶之路

最新推荐文章于 2024-07-15 23:43:23 发布

阅读量448

点赞数

分类专栏：数据分析

本文链接：https://blog.csdn.net/qq_40981268/article/details/101832458

版权

本文介绍了NumPy如何实现高效的数组处理，通过内存优化和多线程计算提升性能。强调了避免隐式拷贝，采用就地操作的原则，并展示了创建数组、ufunc运算、算术操作、统计函数及排序等示例。

摘要由CSDN通过智能技术生成

NumPy更加高效

NumPy数组结构比Python本身的list更加的节省资源：
列表 list 的元素在系统内存中是分散存储的，而 NumPy 数组存储在一个均匀连续的内存块中。这样数组计算遍历所有的元素，不像列表 list 还需要对内存地址进行查找，从而节省了计算资源。

另外在内存访问模式中，缓存会直接把字节块从 RAM 加载到 CPU 寄存器中。因为数据连续的存储在内存中，NumPy 直接利用现代 CPU 的矢量化指令计算，加载寄存器中的多个连续浮点数。另外 NumPy 中的矩阵计算可以采用多线程的方式，充分利用多核 CPU 计算资源，大大提升了计算效率。

当然除了使用 NumPy 外，你还需要一些技巧来提升内存和提高计算资源的利用率。一个重要的规则就是：避免采用隐式拷贝，而是采用就地操作的方式。举个例子，如果我想让一个数值 x 是原来的两倍，可以直接写成 x*=2，而不要写成 y=x*2。

NumPy总结：

NumPy与标准Python的最大区别在于，数组。
在这里插入图片描述

NumPy使用的demo:

1. 创建数组

import numpy as np
a = np.array([1, 2, 3])
b = np.array([[1, 2, 3], [4, 5, 6], [7, 8, 9]])
b[1,1]=10
print a.shape
print b.shape
print a.dtype
print b

output:

(3L,)
(3L, 3L)
int32
[[ 1  2  3]
[ 4 10  6]
[ 7  8  9]]

2. 结构数组

import numpy as np
persontype = np.dtype({
   
    'names':['name', 'age', 'chinese', 'math', 'english'],
    'formats':['S32','i', 'i', 'i', 'f']})
peoples = np.array([("ZhangFei",32,75,100, 90),("GuanYu",24,85,96,88.5),
       ("ZhaoYun",28,85,92,96.5),(

最低0.47元/天解锁文章

大白羊的进阶之路

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
3
评论
数据分析（3）python科学计算：用NumPy快速处理数据

NumPy更加高效NumPy数组结构比Python本身的list更加的节省资源：列表 list 的元素在系统内存中是分散存储的，而 NumPy 数组存储在一个均匀连续的内存块中。这样数组计算遍历所有的元素，不像列表 list 还需要对内存地址进行查找，从而节省了计算资源。另外在内存访问模式中，缓存会直接把字节块从 RAM 加载到 CPU 寄存器中。因为数据连续的存储在内存中，NumPy 直接...
复制链接

扫一扫

专栏目录