【numpy基础】--结构化

1. 关联不同类型数据

numpy的数组为了提高计算性能,要求数组的数据类型要一致。
但是现实情况下,我们经常遇到不是纯数值的数组,比如:

name = ["harry", "tom", "annie"]
sex = ["male", "male", "female"]
age = [40, 31, 14]

arr = np.array([name, sex, age])
print(arr)
#运行结果
[['harry' 'tom' 'annie']
 ['male' 'male' 'female']
 ['40' '31' '14']]

上面三个数组的类型不一致,放到一个numpy数组中时,可以看出,age数组被自动转换为字符串类型了。

为了保持 age 数组的原有数据类型,就要用到numpy结构化数组了。

arr = np.zeros(
    3,
    dtype={"names": ("name", "sex", "age"), 
           "formats": ("U10", "U10", "i4")},
)
print(arr)
#运行结果
[('', '', 0) ('', '', 0) ('', '', 0)]

arr["name"] = name
arr["sex"] = sex
arr["age"] = age
print(arr)
#运行结果
[('harry', 'male', 40) 
 ('tom', 'male', 31)
 ('annie', 'female', 14)]

定义数组时,定义不同的namesformats,这样,最后得到了结构化的数组,每个元素是一个元组元组中的三个元素分别是namesexage

这样的数组,保持了原数组的数据的类型。
补充:上面代码中的 U10 表示长度小于10 的字符串,i4 表示占4个字节的整数。

2. 结构化数组

生成结构化数组的关键在于定义不同的数据类型。
定义数据了类型有两种方式:
第一种是用字典,类似上面的示例那样,

dtp = np.dtype(
    {"names": ("name", "sex", "age"), 
     "formats": ("U10", "U10", "i4")}
)
arr = np.zeros(3, dtype=dtp)

arr["name"] = name
arr["sex"] = sex
arr["age"] = age
print(arr)
#运行结果
[('harry', 'male', 40) 
 ('tom', 'male', 31)
 ('annie', 'female', 14)]

还有一种方式是用元组列表来定义:

dtp = np.dtype([
    ("name", "U10"), 
    ("sex", "U10"),
    ("age", "i4")
])
arr = np.zeros(3, dtype=dtp)

arr["name"] = name
arr["sex"] = sex
arr["age"] = age
print(arr)
#运行结果
[('harry', 'male', 40) 
 ('tom', 'male', 31)
 ('annie', 'female', 14)]

两种方式定义出的结构化数组是一样的。

3. 更复杂的结构

除了定义上面那种类似excel表格的二维结构之外,numpy的数组也能定义跟复杂的结构。
比如定义学生的成绩列表:

dtp = np.dtype([("name", "U10"), ("scores", "f4", (3))])
arr = np.zeros(3, dtype=dtp)
print(arr)
#运行结果
[('', [0., 0., 0.]) 
 ('', [0., 0., 0.]) 
 ('', [0., 0., 0.])]

arr["name"] = ["harry", "tom", "annie"]
arr["scores"] = [[100, 95.5, 93], [89, 90, 78.5], [77.5, 76, 90]]
print(arr)
#运行结果
[('harry', [100. ,  95.5,  93. ]) 
 ('tom', [ 89. ,  90. ,  78.5])
 ('annie', [ 77.5,  76. ,  90. ])]

每个学生对应一个成绩列表,列表中包含3个成绩。

4. 总结回顾

总的来说,numpy结构化数组并不常用,对于结构化数组,使用 pandas库来操作更好。
numpy库一般作为纯数值计算的底层来使用,其实pandas也是基于 numpy 的。

此外,还有很多其他的python科学计算的库也是基于numpy的。

  • 8
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

野生的狒狒

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值