学习Numpy，看这篇文章就够啦

最新推荐文章于 2024-07-24 23:27:06 发布

大数据v

最新推荐文章于 2024-07-24 23:27:06 发布

阅读量823

点赞数

文章标签：大数据编程语言 python 人工智能数据分析

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zw0Pi8G5C1x/article/details/108353569

版权

本文详细探讨了Python数据分析库Numpy的核心对象ndarray，包括其创建、索引、基础操作和ufunc功能。文章指出，ndarray提供了一种高效处理大量数据的方式，与Python内置的list相比，它在计算速度和内存使用上有所优化。此外，文章还补充了多种创建ndarray的方法，如从字节流和文件中创建，并讨论了随机数生成。在索引部分，文章不仅介绍了基本的一维和多维索引，还涉及了布尔索引和花式索引。文章进一步讲解了ndarray的形状操作、排序、搜索、字符串操作以及ufunc的广播机制和常用函数。最后，文章提到了Numpy的matrix对象以及文件读写操作，特别补充了多维数据的存取方法。

摘要由CSDN通过智能技术生成

导读：在数据分析当中，Python用到最多的第三方库就是Numpy。本文内容是「大数据DT」内容合伙人王皓阅读学习《Python 3智能数据分析快速入门》过后的思考和补充，结合这本书一起学习，效果更佳。

作者：王皓

来源：大数据DT（ID：hzdashuju）

01 ndarray创建与索引

在学习Numpy之前我们需要了解一个概念：数组维数。

在计算机科学中，数组数据结构（array data structure），简称数组（Array），是由相同类型的元素的集合所组成的数据结构，分配一块连续的内存来存储。按数组维数分类可分为：一维数组、二维数组、多维数组（N维数组）。

Numpy是最著名的 Python库之一，常用于高性能计算。Numpy提供了两种基本对象：ndarray和ufunc。

NumPy作为一个开源的Python科学计算基础库，包含：一个强大的N维数组对象ndarray ；广播功能函数；整合C/C++/Fortran代码的工具；线性代数、傅里叶变换、随机数生成等功能。NumPy是SciPy、Pandas等数据处理或科学计算库的基础。

当然这里就有一个问题出现了，Python已有列表类型，为什么需要一个数组对象(类型)？

因为：

数组对象可以去掉元素间运算所需的循环，使一维向量更像单个数据
设置专门的数组对象，经过优化，可以提升这类应用的运算速度，在科学计算中，一个维度所有数据的类型往往相同
数组对象采用相同的数据类型，有助于节省运算和存储空间

但是Python内置的array模块既不支持多维数组功能，又没有配套对应的计算函数，所以基于Numpy的ndarray在很大程度上改善了Python内置array模块的不足，将重点介绍ndarray的创建与索引。

1. 创建ndarray对象

1）ndarray数据类型

在《Python 3智能数据分析快速入门》该节内容中，作者罗列了15种数据类型，其中实数数据类型13种。这些实数数据类型之间可以互相转换。

这时有人会问，为什么要支持这么多种数据类型？是因为对比Python语法来说仅支持整数、浮点数和复数3种类型，但是当科学计算涉及数据较多，对存储和性能都有较高要求，所以对数据类型进行精细定义，有助于NumPy合理使用存储空间并优化性能和程序员对程序规模有合理评估。

对于15种数据类型在这里笔者将不赘述，书上有详细的解释以及案例示范。

2）ndarray创建

在《Python 3智能数据分析快速入门》该节内容中，作者介绍了两种创建ndarray的方法：

使用array函数创建数ndarray
使用arange函数创建数ndarray

这里笔者再补充四种方法并整理出来：

从Python中的列表、元组等类型创建ndarray数组
使用NumPy中函数创建ndarray数组，如：arange, ones, zeros等
从字节流（raw bytes）中创建ndarray数组
从文件中读取特定格式，创建ndarray数组

对于方法②再补充5个常用函数：

np.full(shape,val)：根据shape生成一个数组，每个元素值都是val
np.ones_like(a)：根据数组a的形状生成一个全1数组
np.zeros_like(a)：根据数组a的形状生成一个全0数组
np.full_like(a,val)：根据数组a的形状生成一个数组，每个元素值都是val
np.concatenate()：将两个或多个数组合并成一个新的数组

3）随机数

Numpy提供了强大的生成随机数的功能，使用随机数也能创建ndarray。基本语法格式：numpy.random.×××() 。在《Python 3智能数据分析快速入门》该节内容中，作者罗列了13个函数及其说明，笔者再补充2个函数：

choice

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。