《Python数据分析》一2.4 NumPy的数值类型

最新推荐文章于 2022-05-10 21:49:04 发布

weixin_34175509

最新推荐文章于 2022-05-10 21:49:04 发布

阅读量104

点赞数

文章标签： python

原文链接：https://yq.aliyun.com/articles/96981

版权

本节书摘来自异步社区《Python数据分析》一书中的第2章，第2.4节，作者【印尼】Ivan Idris，更多章节内容可以访问云栖社区“异步社区”公众号查看

2.4 NumPy的数值类型

Python自身虽然支持整型、浮点型和复数型，但对于科学计算来说，还远远不够。现实中，我们仍然需要更多的数据类型，来满足在精度和存储大小方面的各种不同的要求。为此，NumPy提供了更加丰富的数据类型。注意，NumPy跟数学运算有关的数据类型的名称都以数字结尾。而这个数字指示了该类型的变量所占用的二进制位数。表2-1（改编自《NumPy用户指南》）概述了NumPy的各种数值类型。

354ed3af904e2e59b12ae6acbdf1dd2da92b6a32

每一种数据类型都有相应的转换函数（请参考本书代码包中的numericaltypes.py文件），如下所示：

In: float64(42)
Out: 42.0
In: int8(42.0)
Out: 42
In: bool(42)
Out: True
In: bool(0)
Out: False
In: bool(42.0)
Out: True
In: float(True)
Out: 1.0
In: float(False)
Out: 0.0

许多函数都带有一个指定数据类型的参数，该参数通常是可选的：

In: arange(7, dtype=uint16)
Out: array([0, 1, 2, 3, 4, 5, 6], dtype=uint16)

谨记：不允许把复数类型转化成整型。当你企图进行这种转换时，将会触发TypeError错误，就像下面这样：

In: float(42.0 + 1.j)
Traceback (most recent call last):
　File "numericaltypes.py", line 45, in 
　　 print float(42.0 + 1.j)
TypeError: can't convert complex to float

同样，也不允许把复数转化成浮点数。另外，复数的分量j是其虚部的系数。不过，允许把浮点数转换成复数，如complex(1.0)是合法的。复数的实部和虚部分别使用real()函数和imag()函数提取。

2.4.1 数据类型对象

数据类型对象是numpy.dtype类的实例。数组是一种数据类型。严格来讲，NumPy数组中的每个元素都要具有相同的数据类型。数据类型对象表明了数据占用的字节数。所占用字节的具体数目一般存放在类dtype（详见dtypeattributes.py文件）的itemsize属性中。

In: a.dtype.itemsize
Out: 8

2.4.2 字符码

NumPy之所以提供字符码，是为了与其前身Numeric向后兼容。一般不建议使用字符码，这里为什么又提供这些代码呢？因为我们会在许多地方碰到它们，但是，编写代码时应当使用dtype对象。表2-2展示了一些数据类型及其相应的字符码。

57b7788cbf9f5819b23d6cae9261d55a5cda00ff

下面的代码（代码取自本书代码包中的charcodes.py文件）将生成一个单精度浮点型的数组：

In: arange(7, dtype='f')
Out: array([ 0.,　1.,　2.,　3.,　4.,　5.,　6.], dtype=float32)`

类似地，下列代码将创建一个负数类型的数组：

In: arange(7, dtype='D')
Out: array([ 0.+0.j,　1.+0.j,　2.+0.j,　3.+0.j,　4.+0.j,　5.+0.j,　6.+0.j])

2.4.3 Dtype构造函数

创建数据类型时，手段有很多，下面以浮点型数据为例进行说明（以下代码取自本书代码包中的dtypeconstructors.py文件）。

可以用Python自带的常规浮点型，代码如下所示：`

 In: dtype(float)
　 Out: dtype('float64')

可以用字符码规定单精度浮点数，代码如下所示：

 In: dtype('f')
　 Out: dtype('float32')

可以用字符码定义双精度浮点数，代码如下所示：

 In: dtype('d')
　 Out: dtype('float64')

可以向dtype构造函数传递一个双字符码。其中，第一个字符表示数据类型，第二个字符是一个数字，表示该类型占用的字节数（数字2、4和8分别对应于16位、32位和64位浮点数）：

 In: dtype('f8')
　 Out: dtype('float64')

可以通过sctypeDict.keys()函数列出所有数据类型的字符码，代码如下所示。注意，由于输出内容过多，这里只截取了部分内容。

In: sctypeDict.keys()
Out: [0, …
 'i2',
 'int0']

2.4.4 dtype属性

类dtype提供了许多有用的属性，如可以通过dtype的属性获取某种数据类型对应的字符码（以下代码取自本书代码包中的dtypeattributes2.py文件）：

In: t = dtype('Float64')
In: t.char
Out: 'd'

类型属性相当于数组元素对象的类型：

In: t.type
Out: <type 'numpy.float64'>

dtype的属性str中保存的是一个表示数据类型的字符串，其中第一个字符描述字节顺序，如果需要，后面会跟着字符码和数字，用来表示存储每个数组元素所需的字节数。这里，字节顺序（endianness）规定了32位或64位字内部各个字节的存储顺序。对于大端（big-endian）顺序，先存放权重最高的字节，用符号>指出。当使用小端（little-endian）顺序时，先存放权重最低的字节，用符号<指出。下面以代码为例进行说明：

In: t.str
Out: '<f8'

weixin_34175509

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
《Python数据分析》一2.4 NumPy的数值类型

本节书摘来自异步社区《Python数据分析》一书中的第2章，第2.4节，作者【印尼】Ivan Idris，更多章节内容可以访问云栖社区“异步社区”公众号查看2.4 NumPy的数值类型Python自身虽然支持整型、浮点型和复数型，但对于科学计算来说，还远远不够。现实中，我们仍然需要更多的数据类型，来满足在精度和存储大小方面的各种不同的要求。为此，Nu...
复制链接

扫一扫