2024年Python最全Python numpy之结构化数据类型_numpy结构化数据类型

我们使用Python中dict可以轻松使用key-value形式、list或者tuple就可以定义如下数据。

Python dict 字典实现:

stu1 = {“name”:“Tom”,“age”:10,“weight”:50}
stu2 = {“name”:“Anne”,“age”:12,“weight”:42}
stu_list = [stu1,stu2]
复制代码


Python list+tuple实现

stu_list = [(“Tom”,10,50),(“Anne”,12,42)]
复制代码


对于numpy 结构化数组,通过 dtype 定义每个字段数据类型,实现如下

stu_list = np.array([(“Tom”,10,50),(“Anne”,12,42)],dtype=[(“name”,“U10”),(“age”,“i4”),(“weight”,“i8”)])
stu_list
array([(‘Tom’, 10, 50), (‘Anne’, 12, 42)],
dtype=[(‘name’, ‘<U10’), (‘age’, ‘<i4’), (‘weight’, ‘<i8’)])

复制代码


numpy 数组中,我们可以通过dtype 查询数组中元素的数据类型。

在上述案例中,我们定义name字段数据类型为Unicode,age字段为int32,weight字段为int64

numpy 支持的数据类型与C语言的数据类型对应,常见的有如下几个及对应的内置码

| 数据类型 | 内置码 | 意义 |
| --- | --- | --- |
| int8 | i1 | 字节(-128 to 127) |
| int16 | i2 | 整数,16位字节 |
| int32 | i4 | 整数,32位字节 |
| int64 | i8 | 整数,64位字节 |
| float16 | f2 | 浮点型,16位字节 |
| float32 | f4 | 浮点型,32位字节 |
| float64 | f8 | 浮点型,64位字节 |
| bool_ | b | 布尔类型 |
| Unicode | U | Unicode编码 |
| String | S | 字符串 |

  • 结构化数组特点

    • 结构化数据类型创建来源于 C 语言数据结构,并且可以共享内存空间
    • numpy 结构化数组是解决C代码接口和结构化缓冲区的低级操作
    • 结构化数组支持数据嵌套、联合,并允许控制其内存布局
    • 结合化数组因为基于C结构的内存布局,不适合操作表格数据导致缓存行为不佳

2. 结构化数据类型类型

通过上述,我们知道numpy 结构化数组与普数组主要区别是,在创建时需要通过dtype定义数组中数据字段类型。

因此,结构化数据类型可以被看做一定长度的字节序列(itemsize),通常被解释为字段的集合。

通常字段中主要由三部分组成:字段名称,数据类型和字节偏移量(可选)

3. 结构化数据类型创建

在 numpy 库中我们可以使用 numpy.dtypej来进行创建结构化数据类型。

  • 方法一:元组列表形式

在结构化数据类型创建可以使用元组形式进行定义。

+ 每一个元组表示一个字段的,形式如(name,datatype,shape)
+ 元组中的shape 字段是可选字段
+ datatype可以定义为任何类型
>>> np.dtype([("address","S5"),("family","U10",(2,2))])
dtype([('address', 'S5'), ('family', '<U10', (2, 2))])
>>>
复制代码

  • 方法二:以逗号分隔

在numpy 库中可以支持带逗号分隔基本格式字符串来定义dtype。

+ 逗号分隔基本格式字符串形式如:“i7,f4,U10”
+ 字段中name系统自动生成如:f0,f1等形式
+ 字段中的偏离量系统自动确认
>>> np.dtype("i8,S4,f4")
dtype([('f0', '<i8'), ('f1', 'S4'), ('f2', '<f4')])
>>> np.dtype("i8,S4,(5,3)f4")
dtype([('f0', '<i8'), ('f1', 'S4'), ('f2', '<f4', (5, 3))])
>>>

复制代码

  • 方法三:以字典形式表示各参数

以Python 字典 key-value 形式定义每个字段参数类型。

+ 字典形式定义字段形式如:{“name”:[],“formats”:[],“offsetd”:[],“itemsize”:}
+ name 代表:长度相同的字段名称列表

在这里插入图片描述

感谢每一个认真阅读我文章的人,看着粉丝一路的上涨和关注,礼尚往来总是要有的:

① 2000多本Python电子书(主流和经典的书籍应该都有了)

② Python标准库资料(最全中文版)

③ 项目源码(四五十个有趣且经典的练手项目及源码)

④ Python基础入门、爬虫、web开发、大数据分析方面的视频(适合小白学习)

⑤ Python学习路线图(告别不入流的学习)

网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。

需要这份系统化学习资料的朋友,可以戳这里无偿获取

一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值