python如何减小内存_如何将Python内存占用缩小20倍？

最新推荐文章于 2024-05-23 09:52:57 发布

weixin_39559469

最新推荐文章于 2024-05-23 09:52:57 发布

阅读量537

点赞数

文章标签： python如何减小内存

本文链接：https://blog.csdn.net/weixin_39559469/article/details/111448312

版权

当程序执行过程中RAM中有大量对象处于活动状态时，可能会出现内存问题，特别是在对可用内存总量有限制的情况下。

下面概述了一些减小对象大小的方法，这些方法可以显著减少纯Python程序所需的RAM数量。

为了简单起见，我们将考虑用Python中的结构来表示坐标为x、y、z的点，并通过名称来访问坐标值。

Dict

在小程序中，特别是在脚本中，使用内置的dict来表示结构信息是非常简单方便的:

如何将Python内存占用缩小20倍？

随着Python 3.6中使用一组有序键的更紧凑实现方式的出现，dict变得更有吸引力。但是，让我们看看它在RAM中的内存大小:

如何将Python内存占用缩小20倍？

它需要大量内存，特别是当你突然需要创建大量实例时:

如何将Python内存占用缩小20倍？

类实例

对于那些喜欢将所有东西放置在类中的人来说，最好将结构定义为一个可以通过属性名访问的类，:

如何将Python内存占用缩小20倍？

类实例的结构很有趣：

如何将Python内存占用缩小20倍？

这里的weakref是对这个对象的所谓弱引用列表的一个引用，dict字段是对类实例字典的引用，它包含实例属性的值(注意64位的引用平台会占用8个字节)。从Python 3.3开始，共享空间用于在字典中存储类的所有实例的键。这减少了RAM中实例堆栈的大小:

如何将Python内存占用缩小20倍？

因此，大量的类实例占用的内存比一个普通字典(dict)占用的要小:

如何将Python内存占用缩小20倍？

很容易看出，由于实例字典的大小，RAM中实例的大小仍然很大。

带有slots的类实例

通过消除 dict和weakref，可以显著减小RAM中的类实例的大小。这通过一个带有slots的小“技巧”是可能实现的：

如何将Python内存占用缩小20倍？

RAM中的对象大小明显变小了:

如何将Python内存占用缩小20倍？

在类定义中使用slots可以显著减少大量实例对内存空间的占用:

如何将Python内存占用缩小20倍？

目前，这是大幅度减少RAM中类实例的内存占用的主要方法。

这是因为在内存中，对象引用会紧跟标题之后被存储在内存中——属性值，并通过类字典中的特殊描述符来访问它们:

如何将Python内存占用缩小20倍？

要自动化使用 slots创建一个类的过程，有一个库[namedlist] (https://pypi.org/project/namedlist )可以使用。namedlist.namedlist函数会创建一个带有slots的类:

如何将Python内存占用缩小20倍？

另一个包[attrs] (https://pypi.org/project/attrs )允许你使用和不使用slots自动创建类。

元组

Python还有一个内置的类型tuple(元组)，用于表示不可变的数据结构。一个元组是一个固定的结构或记录，但没有字段名。对于字段访问，使用的是字段索引。元组字段在元组实例创建时就一次性与值对象相关联:

如何将Python内存占用缩小20倍？

元组的实例是相当简洁的：

如何将Python内存占用缩小20倍？

它们在内存中占用的字节比使用slots的类实例要多8个字节，因为内存中的元组跟踪也包含许多字段:

如何将Python内存占用缩小20倍？

Namedtuple(命名元组)

由于元组使用的非常广泛，某天有人可能会提交一个通过名称访问字段的请求。这个请求的答案是collections.namedtuple模块。

namedtuple函数的目的是自动生成这样的类:

如何将Python内存占用缩小20倍？

它会创建一个元组子类，其中定义了用于按名称访问字段的描述符。在我们的例子中，它看起来是这样的:

如何将Python内存占用缩小20倍？

这些类的所有实例都具有与元组相同的内存占用量。大量的实例会占用更大的内存空间:

如何将Python内存占用缩小20倍？

Recordclass: 没有循环GC的可变namedtuple

由于tuple和相应的namedtuple类会生成不可变对象，因此，ob.x属性就不能再与另一个值对象相关联了，对可变namedtuple变体的请求已经出现了。由于Python中没有与支持赋值的元组相同的内置类型，因此，开发者们创建了许多选项。我们将关注[recordclass] (https://pypi.org/project/recordclass )，它的评级为[stackoverflow] (https://stackoverflow.com/questions/29290359/ exists -of-mutable-name - tuplein -python / 29419745 )。此外，与类元组对象的大小相比，它还可以用来减小RAM中对象的大小。

包recordclass引入了recordclass.mutabletuple类型，它几乎与tuple相同，但它支持赋值。在此基础上，创建的子类几乎与namedtuple完全相同，但它支持将新值赋给字段(不需要创建新的实例)。recordclass函数与namedtuple函数一样，允许你自动创建这些类:

如何将Python内存占用缩小20倍？

只有在没有PyGC_Head的情况下，类实例才具有与tuple相同的结构：

如何将Python内存占用缩小20倍？

默认情况下，recordclass函数会创建一个不参与循环垃圾回收机制的类。通常，namedtuple和recordclass用于生成表示记录或简单(非递归)数据结构的类。在Python中正确使用它们就不会生成循环引用。出于这个原因, 在recordclass生成的类实例后面 ,默认情况下,PyGC_Head 部分会被排除在外, 这对支持循环垃圾回收机制(更准确地说:在与创建的类相关联的PyTypeObject结构中,默认情况下,flag字段中的Py_TPFLAGS_HAVE_GC是没有设置的)的类来说是必要的。

大量实例的内存占用量比使用了slots的类的实例要小:

如何将Python内存占用缩小20倍？

Dataobject

recordclass库中提出的另一个解决方案是基于这样的思想:在内存中使用与带有slots的类实例相同的存储结构，但不参与循环垃圾回收机制。这些类是使用recordclass.make_dataclass数生成的:

如何将Python内存占用缩小20倍？

默认情况下，以这种方式创建的类将创建可变实例。

另一种方法——使用继承自recordclass.dataobject的类声明:

如何将Python内存占用缩小20倍？

以这种方式创建的类将创建不参与循环垃圾回收机制的实例。内存中实例的结构与使用slots的情况相同，但是没有PyGC_Head:

如何将Python内存占用缩小20倍？

为了访问字段，还可以使用特殊的描述符通过它从对象开始的偏移量来访问，这些偏移量位于类字典中:

如何将Python内存占用缩小20倍？