Python 之代码块和小数据池

Python程序中的代码块有各自的执行环境,id用于获取对象的内存地址,is比较内存地址。Python对小整数(-5到256)和特定字符串实行缓存策略,减少内存中重复对象,提高效率。同一代码块内多次初始化相同对象会重用已有内存,不同代码块间的小整数和特定字符串会驻留在小数据池中,节省内存。
摘要由CSDN通过智能技术生成

id,is,==,=

  • id 是内存地址,那什么是内存地址呢?你只要创建一个数据(对象),Python 会在内存中开辟一个空间,这个空间有一个唯一标识,这个标识就叫做内存地址,也就是这个数据(对象)的id,可以用 id() 获取这个数据的内存地址:

    name = 'lp'
    print(id(name))  # 158xxxxxxxxx
    
  • == 比较两边的数值是否相等。

  • is 比较两边的内存地址是否相等。如果内存地址相等,那么这两边其实是指向同一个内存地址。
    可以说如果内存地址相同,那么值肯定相同,但是如果值相同,内存地址不一定相同。

  • = 为赋值,赋予的是内存地址。

代码块

官方文档:

A Python program is constructed from code blocks. A block is a piece of Python program text that is executed as a unit. The following are blocks: a module, a function body, and a class definition. Each command typed interactively is a block. A script file (a file given as standard input to the interpreter or specified as a command line argument to the interpreter) is a code block. A script command (a command specified on the interpreter command line with the ‘-c‘ option) is a code block. The string argument passed to the built-in functions eval() and exec() is a code block.
A code block is executed in an execution frame. A frame contains some administrative information (used for debugging) and determines where and how execution continues after the code block’s execution has completed.

上面的意思是:

Python 程序是由代码块构造的。块是一个 Python 程序的文本,他是作为一个单元执行的。代码块包括:一个模块,一个函数,一个类,一个文件等。交互方式输入的每个命令都是一个代码块。

什么叫交互方式?就是在 cmd 中进入 Python 解释器里面,每一行代码都是一个代码块,例如:

# 这是两个代码块
b = "asdfsdafsfasfasgasgafasdfsdaasdgsadgasd123"
a = "asdfsdafsfasfasgasgafasdfsdaasdgsadgasd123"

而对于一个文件中的两个函数,也分别是两个不同的代码块:

# 这是两个代码块
def fun_a():
    pass
    
def fun_b():
    pass

代码块的缓存机制

前提条件:在同一个代码块内。

机制内容:Python 在执行同一个代码块的初始化对象的命令时,会检查是否其值是否已经存在,如果存在,会将其重用。换句话说:执行同一个代码块时,遇到初始化对象的命令时,他会将初始化的这个变量与值存储在一个字典中,在遇到新的变量时,会先在字典中查询记录,如果有同样的记录那么它会重复使用这个字典中的之前的这个值。满足缓存机制的变量在内存中只存在一个,对应着 id 相同。

适用对象:int(float)、str、bool。

  • int(float):任何数字在同一代码块下都会复用。

  • bool:True 和 False 在字典中会以 1,0 方式存在,并且复用。

  • str:几乎所有的字符串都会符合缓存机制,具体规定如下:

    • 非乘法得到的字符串都满足代码块的缓存机制。
    • 乘法得到的字符串分两种情况:
      • 乘数为1时,任何字符串满足代码块的缓存机制。
      • 乘数>=2时:仅含大小写字母,数字,下划线,总长度<=20,满足代码块的缓存机制。
    s1 = 'abcd'
    s2 = 'abcd'
    print(s1 is s2)  # True
    
    s3 = 'abcd' * 1
    s4 = 'abcd' * 1
    print(s3 is s4)  # True
    
    s5 = 'abcd' * 5
    s6 = 'abcd' * 5
    print(s5 is s6)  # True
    

优点:能够提高一些字符串,整数处理任务在时间和空间上的性能;需要值相同的字符串,整数的时候,直接从"字典"中取出复用,避免频繁的创建和销毁,提升效率,节约内存。

缺点: 在"字典"中创建或者插入新的内容会花费更多的时间。

小数据池

小数据池,不同代码块的缓存机制,也称为小整数缓存机制,或者称为驻留机制等等,只要你在网上查到的这些名字其实说的都是一个意思。

那么到底什么是小数据池?他有什么作用呢?

前提条件:在不同一个代码块内。

机制内容

  • Python 自动将-5~256的整数进行了缓存,当你将这些整数赋值给变量时,并不会重新创建对象,而是使用已经创建好的缓存对象。

  • python 也会将一定规则的字符串在字符串驻留池中,创建一份,当你将这些字符串赋值给变量时,并不会重新创建对象,而是使用在字符串驻留池中创建好的对象。

  • 其实,无论是缓存还是字符串驻留池,都是python做的一个优化,就是将~5-256的整数,和一定规则的字符串,放在一个"池"(容器,或者字典)中,无论程序中那些变量指向这些范围内的整数或者字符串,那么他直接在这个"池"中引用,言外之意,就是内存中之创建一个。

适用对象:int(float)、str、bool。

  • bool:就是 True 和 False,无论创建多少个变量指向 True,False,在内存中都只存在一个。

  • int:对于整数来说,小数据池的范围是-5~256 ,如果多个变量都是指向同一个(在这个范围内的)数字,他们在内存中指向的都是一个内存地址。

    >>> i1 = 2
    >>> i2 = 2
    >>> i3 = 2345
    >>> i4 = 2345
    >>> id(i1), id(i2), id(i3), id(i4)  # i1 和 i2 相同, i3 和 i4 不同
    (140731896340928, 140731896340928, 2863792405904, 2863792404656)
    
  • str:

    • 字符串的长度为0或者1,默认都采用了驻留机制(小数据池)。

    • 字符串的长度>1,且只含有大小写字母,数字,下划线时,才会默认驻留。

    • 用乘法得到的字符串,分两种情况。

      • 乘数为1时:仅含大小写字母,数字,下划线,默认驻留。
      • 乘数>=2时:仅含大小写字母,数字,下划线,总长度<=20,默认驻留。
      >>> s1 = "@"
      >>> s2 = "@"
      >>> s3 = "adf@"
      >>> s4 = "adf@"
      >>> s5 = "12345689_qwertyuiop_asdfghjkl"
      >>> s6 = "12345689_qwertyuiop_asdfghjkl"
      >>> s7 = s5 * 1
      >>> s8 = s6 * 1
      >>> s9 = s5 * 2
      >>> s10 = s6 * 2
      >>> id(s1),id(s2),id(s3),id(s4),id(s5),id(s6),id(s7),id(s8),id(s9),id(s10)
      (1780956457520, 1780956457520, 1780998980144, 1780998980464, 1780998777072, 1780998777072, 1780998777072, 1780998777072, 1780998855120, 1780998751152)
      # s1 和 s2 相同,s3 和 s4 不同,s5、s6、s7、s8 相同,s9 和 s10 不同。
      
    • 指定驻留。指定驻留是你可以指定任意的字符串加入到小数据池中,让其只在内存中创建一个对象,多个变量都是指向这一个字符串

      from sys import intern
      a = intern('hello!@'*20)
      b = intern('hello!@'*20)
      print(a is b)
      

优点:能够提高一些字符串,整数处理人物在时间和空间上的性能;需要值相同的字符串,整数的时候,直接从‘池’里拿来用,避免频繁的创建和销毁,提升效率,节约内存

缺点: 在"池"中创建或者插入新的内容会花费更多的时间。

小结

  • 如果在同一代码块下,则采用同一代码块下的换缓存机制。
  • 如果是不同代码块,则采用小数据池的驻留机制。
  • 缓存和小数据池只针对整数、字符串、布尔值。其他的数据类型不存在,如列表、元祖等,即使里面只有一个值,赋值时内存地址不一样。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值