Python 之代码块和小数据池

奔跑的大西吉

于 2023-01-18 23:24:27 发布

阅读量428

点赞数 1

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/fenglepeng/article/details/128731432

版权

Python 专栏收录该内容

77 篇文章 13 订阅

订阅专栏

Python程序中的代码块有各自的执行环境，id用于获取对象的内存地址，is比较内存地址。Python对小整数(-5到256)和特定字符串实行缓存策略，减少内存中重复对象，提高效率。同一代码块内多次初始化相同对象会重用已有内存，不同代码块间的小整数和特定字符串会驻留在小数据池中，节省内存。

摘要由CSDN通过智能技术生成

id，is，==，=

id 是内存地址，那什么是内存地址呢？你只要创建一个数据（对象），Python 会在内存中开辟一个空间，这个空间有一个唯一标识，这个标识就叫做内存地址，也就是这个数据（对象）的id，可以用 id() 获取这个数据的内存地址：
```
name = 'lp'
print(id(name))  # 158xxxxxxxxx
```
== 比较两边的数值是否相等。
is 比较两边的内存地址是否相等。如果内存地址相等，那么这两边其实是指向同一个内存地址。
可以说如果内存地址相同，那么值肯定相同，但是如果值相同，内存地址不一定相同。
= 为赋值，赋予的是内存地址。

代码块

官方文档：

A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a module, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the ‘-c‘ option) is a code block. The string argument passed to the built-in functions eval() and exec() is a code block.
A code block is executed in an execution frame. A frame contains some administrative information (used for debugging) and determines where and how execution continues after the code block’s execution has completed.

上面的意思是：

Python 程序是由代码块构造的。块是一个 Python 程序的文本，他是作为一个单元执行的。代码块包括：一个模块，一个函数，一个类，一个文件等。交互方式输入的每个命令都是一个代码块。

什么叫交互方式？就是在 cmd 中进入 Python 解释器里面，每一行代码都是一个代码块，例如：

# 这是两个代码块
b = "asdfsdafsfasfasgasgafasdfsdaasdgsadgasd123"
a = "asdfsdafsfasfasgasgafasdfsdaasdgsadgasd123"

而对于一个文件中的两个函数，也分别是两个不同的代码块：

# 这是两个代码块
def fun_a():
    pass
    
def fun_b():
    pass

代码块的缓存机制

前提条件：在同一个代码块内。

机制内容：Python 在执行同一个代码块的初始化对象的命令时，会检查是否其值是否已经存在，如果存在，会将其重用。换句话说：执行同一个代码块时，遇到初始化对象的命令时，他会将初始化的这个变量与值存储在一个字典中，在遇到新的变量时，会先在字典中查询记录，如果有同样的记录那么它会重复使用这个字典中的之前的这个值。满足缓存机制的变量在内存中只存在一个，对应着 id 相同。

适用对象：int（float）、str、bool。

int(float)：任何数字在同一代码块下都会复用。
bool：True 和 False 在字典中会以 1，0 方式存在，并且复用。
str：几乎所有的字符串都会符合缓存机制，具体规定如下：
- 非乘法得到的字符串都满足代码块的缓存机制。
- 乘法得到的字符串分两种情况：
  - 乘数为1时，任何字符串满足代码块的缓存机制。
  - 乘数>=2时：仅含大小写字母，数字，下划线，总长度<=20，满足代码块的缓存机制。
```
s1 = 'abcd'
s2 = 'abcd'
print(s1 is s2)  # True

s3 = 'abcd' * 1
s4 = 'abcd' * 1
print(s3 is s4)  # True

s5 = 'abcd' * 5
s6 = 'abcd' * 5
print(s5 is s6)  # True
```

优点：能够提高一些字符串，整数处理任务在时间和空间上的性能；需要值相同的字符串，整数的时候，直接从"字典"中取出复用，避免频繁的创建和销毁，提升效率，节约内存。

缺点: 在"字典"中创建或者插入新的内容会花费更多的时间。

小数据池

小数据池，不同代码块的缓存机制，也称为小整数缓存机制，或者称为驻留机制等等，只要你在网上查到的这些名字其实说的都是一个意思。

那么到底什么是小数据池？他有什么作用呢？

前提条件：在不同一个代码块内。

机制内容：

Python 自动将-5~256的整数进行了缓存，当你将这些整数赋值给变量时，并不会重新创建对象，而是使用已经创建好的缓存对象。
python 也会将一定规则的字符串在字符串驻留池中，创建一份，当你将这些字符串赋值给变量时，并不会重新创建对象，而是使用在字符串驻留池中创建好的对象。
其实，无论是缓存还是字符串驻留池，都是python做的一个优化，就是将~5-256的整数，和一定规则的字符串，放在一个"池"（容器，或者字典）中，无论程序中那些变量指向这些范围内的整数或者字符串，那么他直接在这个"池"中引用，言外之意，就是内存中之创建一个。

适用对象：int（float）、str、bool。

bool：就是 True 和 False，无论创建多少个变量指向 True，False，在内存中都只存在一个。

int：对于整数来说，小数据池的范围是-5~256 ，如果多个变量都是指向同一个（在这个范围内的）数字，他们在内存中指向的都是一个内存地址。

>>> i1 = 2
>>> i2 = 2
>>> i3 = 2345
>>> i4 = 2345
>>> id(i1), id(i2), id(i3), id(i4)  # i1 和 i2 相同， i3 和 i4 不同
(140731896340928, 140731896340928, 2863792405904, 2863792404656)

str：

字符串的长度为0或者1，默认都采用了驻留机制（小数据池）。
字符串的长度>1，且只含有大小写字母，数字，下划线时，才会默认驻留。

用乘法得到的字符串，分两种情况。

乘数为1时：仅含大小写字母，数字，下划线，默认驻留。
乘数>=2时：仅含大小写字母，数字，下划线，总长度<=20，默认驻留。

>>> s1 = "@"
>>> s2 = "@"
>>> s3 = "adf@"
>>> s4 = "adf@"
>>> s5 = "12345689_qwertyuiop_asdfghjkl"
>>> s6 = "12345689_qwertyuiop_asdfghjkl"
>>> s7 = s5 * 1
>>> s8 = s6 * 1
>>> s9 = s5 * 2
>>> s10 = s6 * 2
>>> id(s1),id(s2),id(s3),id(s4),id(s5),id(s6),id(s7),id(s8),id(s9),id(s10)
(1780956457520, 1780956457520, 1780998980144, 1780998980464, 1780998777072, 1780998777072, 1780998777072, 1780998777072, 1780998855120, 1780998751152)
# s1 和 s2 相同，s3 和 s4 不同，s5、s6、s7、s8 相同，s9 和 s10 不同。

指定驻留。指定驻留是你可以指定任意的字符串加入到小数据池中，让其只在内存中创建一个对象，多个变量都是指向这一个字符串
```
from sys import intern
a = intern('hello!@'*20)
b = intern('hello!@'*20)
print(a is b)
```