来源: https://www.bilibili.com/video/BV19S4y1F7xq?spm_id_from=333.999.0.0
说明:具体占用的byte和python版本,系统版本(不同的windows版本或者linux或者MAC OS)有关,大体上所表达的意思明白就好.
一、 现象
三个元素一样的列表,内存占用却不一样
import sys
sys.getsizeof([0]*3)
80
sys.getsizeof([0,0,0])
120
sys.getsizeof([0 for _ in range(3)])
88
二、原因
这三个方法调用的底层C函数不同。(python底层是用C语言实现的,python会被转化层字节码,C语言解析字节码,并用C语言运行)
下面是不同的方法的字节码(利用dis
模块可以查看),可以看到3个不同的方法的字节码是不一样的,每个方法的核心如下面的箭头所指
2.1 [0]*3 为什么是80个byte
因为此时,C语言内部的实现方式是直接申请了3个指针,指向三个元素。
在测试平台上,空的list是56个byte,64bit的系统上每个指针是8个byte,因此总共是80个byte
2.2 [0,0,0] 为什么是120个byte
此时内部直接调用list_resize(3)
这个函数,意思是就是申请3个对象,但是动态数组会自动多申请一些(参见C++ std::vector的动态扩容机制) 。按照C里面的实现会直接申请8个内存块,那么8个指针就是64个byte,加上空list自带的56个byte,总共就是120个byte
2.3 [0 for _ in range(3)] 为什么是88个byte
因为内部会循环调用list_resize
分别是list_resize(1)
list_resize(2)
list_resize(3)
.按照C里面的实现方式list_resize(1)
就会分配4个内存块,在后面使用 list_resize(2)
list_resize(3)
的时候,因为当前空间已经满足用户的使用了,所以就不会再申请空间了。(类似C++的std::vector的扩容机制)