python的变量作用域

1. 不在函数体内的变量或者在 if __name__=='__main__'中的变量,都是全局变量,注意访问这些全局变量的速度是比较慢的,因为这些全局变量放在一个全局的表中,需要查找

2. 在函数体内,如果不没有对变量的赋值操作,默认这个变量是全局变量,就是要从全局的表中查找

3. 在函数体内,如果有对变量的赋值操作,则这边变量是局部变量;如果想在函数体内修改全局变量,只需在函数体内声明global即可


http://hyry.dip.jp/tech/book/page/python/variable_scope_global.html

访问全局变量

在函数内部可以访问全局变量,例如:

def f1():
    print x

在函数f1()创建时,无论表示全局对象字典的func_globals属性中是否存在”x”,在函数内部变量x都会当作全局变量处理。只要在f1()运行时能找到全局变量x即可。通过代码对象的co_names属性可以获得代码中访问的全局变量名,而co_varnames属性可以获得代码中使用的局域变量名。

co_names并不是单纯用来保存全局变量名,后面我们还会看到其它的用法。
>>> run variable_scope02.py
>>> f1.func_code.co_names     # 全局变量名
('x',)
>>> f1.func_code.co_varnames  # 局域变量名
()

如果函数中存在对变量x赋值的语句,那么它将被当作函数的局域变量:

def f2():
    x = 10
    print x
>>> f2.func_code.co_names
()
>>> f2.func_code.co_varnames
('x',)

通过查看字节码,可以发现其中的区别:

>>>  dis.dis(f1)
  4           0 LOAD_GLOBAL              0 (x)
              3 PRINT_ITEM
              4 PRINT_NEWLINE
              5 LOAD_CONST               0 (None)
              8 RETURN_VALUE

>>>  dis.dis(f2)
 10           0 LOAD_CONST               1 (10)
              3 STORE_FAST               0 (x)

 11           6 LOAD_FAST                0 (x)
              9 PRINT_ITEM
             10 PRINT_NEWLINE
             11 LOAD_CONST               0 (None)
             14 RETURN_VALUE

在f1()中使用LOAD_GLOBAL命令载入变量x的值,而在f2()中则使用LOAD_FAST和STORE_FAST命令存取变量的值。查看这几个命令的帮助可知:

  • LOAD_GLOBAL在代码对象的co_names属性中寻找变量名。
  • LOAD_FAST和STORE_FAST在代码对象的co_varnames属性中寻找变量名。

请注意这些命令的参数都为整数,变量名是通过将参数作为下标从对应的变量名元组中获得的。所以:“LOAD_GLOBAL 0”相当于载入f1.func_globals[f1.func_code.co_names[0]]对象。

对于局域变量,Python做了尽可能的优化处理,因此它使用LOAD_FAST和STORE_FAST对局域变量进行存取,它们可以通过其参数直接存取一个用来保存局域变量的C语言数组。

如果我们希望函数修改全局变量,那么需要在函数内使用global关键字进行声明。

def f3():
    global x
    x = 20
    print x
>>> dis.dis(f3)
 17           0 LOAD_CONST               1 (20)
              3 STORE_GLOBAL             0 (x)

 18           6 LOAD_GLOBAL              0 (x)
              9 PRINT_ITEM
             10 PRINT_NEWLINE
             11 LOAD_CONST               0 (None)
             14 RETURN_VALUE

可以看到当使用global关键字将变量x声明为全局变量之后,字节码中就改为使用STORE_GLOBAL和LOAD_GLOBAL命令了。

由上述的结果我们可以做如下总结:

  • 在函数内未被赋值而直接使用的变量为全局变量。
  • 在函数内用global声明的均为全局变量,否则若存在赋值语句,则被赋值的变量为局域变量。

全局变量不简单

全局变量的规则虽然简单,但是稍有不慎就会出现一些意想不到的错误。为了防范于未然,读者要牢记Python是先编译成字节码之后再运行的,在编译时变量是全局的还是局域的就已经决定了。然而编译器的工作方式和我们通常理解程序的方式存在区别,因此会出现一些难以发觉的错误。

请避免编写如下容易引起理解混淆的程序。
x = 0
def f1(flag):
    if flag:
        global x
        x = 10
    x = 20
    print x

f1(False)
print x

上面的程序的输出如下:

20
20

这是因为无论global关键字在何处,它的声明对整个函数体都是有效的。当编译器发现函数体中存在“global x”语句,它就把变量x当作全局变量处理。这和我们对代码的直观理解不同,因此请避免编写这种代码。

下面再看一个错误更加隐蔽的例子:

def f2(x):
    print len(x) 
    if False:
        len = 10 
        print len
try:
    f2([1,2,3])
except Exception as ex:
    print ex

由于f2()会抛出异常,因此我们在调用它时用try/except捕捉了错误。程序的输出为:

local variable 'len' referenced before assignment

和global关键字一样,无论对变量的赋值出现在何处,这个变量都会被当作局域变量。甚至它出现在明显不可能被执行的位置。在f2()中,❷由于存在语句“len = 10”,因此len被当作局域变量,在字节码中会使用LOAD_FAST命令载入变量len。❶而运行“len(x)”载入变量len所引用的对象时,LOAD_FAST在局域变量字典中找不到,于是报错。

虽然❷是真正需要修改的语句,Python却会在❶处报错。特别是当函数体较长时,这个错误很难发觉。因此使用内置函数或模块名作为变量名是需要绝对避免的,当你需要用len做为变量名时,可以考虑多添加一个下划线:len_。

exec语句的影响

通过上节的叙述我们知道Python编译器通过global关键字和变量赋值语句决定某个变量是全局还是局域的。然而由于Python是如此的动态,我们可以在函数内部用exec命令动态地将字符串当作程序执行。对于Python编译器来说,这个表示程序的字符串是无法在程序的编译期进行分析的。因此Python必须对其进行额外的处理。

先看一个最简单的例子:

a = 0
def f1():
    exec("a=100")
    print a
f1()
print a

程序的输出为:

100
0

显然Python将变量a当作局域变量处理。但是它应该不能解析exec语句到底执行了什么程序,从而判断变量a是一个局域变量。让我们查看一下编译之后的字节码:

>>> dis.dis(f1)
  7           0 LOAD_CONST               1 ('a=100')
              3 LOAD_CONST               0 (None)
              6 DUP_TOP
              7 EXEC_STMT

  8           8 LOAD_NAME                0 (a)     <--- 使用LOAD_NAME载入变量a的值
             11 PRINT_ITEM
             12 PRINT_NEWLINE
             13 LOAD_CONST               0 (None)
             16 RETURN_VALUE

可以看到字节码中使用LOAD_NAME命令载入变量a的值,而不是LOAD_GLOBAL或LOAD_FAST。LOAD_NAME命令从代码对象的co_names属性读取变量名,然后依次从局域变量的字典以及全局变量的字典寻找对应的值。

>>> f1.func_code.co_names
('a',)

由于exec命令在局域变量字典中创建了变量a,因此LOAD_NAME先找到了它。

和前面所介绍的global关键字以及赋值语句一样,只要函数体中出现exec语句,那么被之前判断为全局的变量都采用LOAD_NAME命令载入。这样,当exec语句动态地创建了局域变量时,能优先载入局域变量的值,当局域变量不存在时,再载入全局变量。

在函数中被赋值的变量,仍然会被当作局域变量,而被global声明的变量则仍然被当作全局变量。

def f3():
    exec("")
    a = 1
    global b
    print a,b,c

因此对于上面的程序,变量a使用LOAD_FAST载入,变量b使用LOAD_GLOBAL载入,而变量c使用LOAD_NAME载入。请读者自行通过查看字节码验证。

请读者思考下面的程序的输出,并通过字节码进行说明。
a = 0
def f2():
    print a
    exec("a=10")
    print a
f2()
print a

由于多了一次查找,因此LOAD_NAME比LOAD_GLOBAL的执行效率略低。下面的程序比较二者的区别。

variable_scope_exec_time.py

当在函数内存在exec语句时,会影响全局变量的查找速度

import time
a = 1
def f1():
    exec ""
    start = time.clock()
    sum_ = 0
    for i in xrange(100000):
        sum_ += a
    print "with exec:", time.clock() - start

def f2():
    start = time.clock()
    sum_ = 0
    for i in xrange(100000):
        sum_ += a
    print "without exec:", time.clock() - start

f1()
f2()

程序的输出为:

with exec: 0.0217457921526
without exec: 0.0197440029085



比较全局变量和局部变量的速度


http://coolshell.cn/articles/7886.html

考虑下面的代码,一个在函数体内,一个是全局的代码。

函数内的代码执行效率为 1.8s

1
2
3
4
def main():
     for i in xrange ( 10 * * 8 ):
         pass
main()

函数体外的代码执行效率为 4.5s

1
2
for i in xrange ( 10 * * 8 ):
     pass

不用太纠结时间,只是一个示例,我们可以看到效率查得很多。为什么会这样呢?我们使用 dis module 反汇编函数体内的bytecode 代码,使用 compile builtin 反汇编全局bytecode,我们可以看到下面的反汇编(注意我高亮的地方)

Main函数反汇编
1
2
3
13 FOR_ITER                 6 (to 22)
16 STORE_FAST               1 (i)
19 JUMP_ABSOLUTE           13
全局代码
1
2
3
13 FOR_ITER                 6 (to 22)
16 STORE_NAME               1 (i)
19 JUMP_ABSOLUTE           13

我们可以看到,差别就是 STORE_FAST 和 STORE_NAME,前者比后者快很多。所以,在全局代码中,变量i成了一个全局变量,而函数中的i是放在本地变量表中,所以在全局变量表中查找变量就慢很多。如果你在main函数中声明global i 那么效率也就下来了。原因是,本地变量是存在一个数组中(直到),用一个整型常量去访问,而全局变量存在一个dictionary中,查询很慢。


  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值