Python的方法解析顺序(MRO)变化过程

MRO,即 Method Resolution Order,是继承中确定调用哪个方法(属性)的搜索顺序方法。
对于只支持单继承的语言(Java和C#)来说,MRO 一般比较简单;而对于 C++, Python 这种支持多继承的语言来说,MRO 就复杂很多。

先看个菱形继承的例子
菱形继承

x = D()
x.show() 调用的是A.show(),还是C.show()呢?不同的搜索顺序,决定了调用关系。

MRO 是把类的继承关系线性化的一个过程,而线性化方式决定了程序运行过程中具体会调用哪个方法。既然如此,那什么样的 MRO 才是最合理的?Python 中又是如何实现的呢?

Python 至少有三种不同的 MRO:

  1. 经典类(classic class)的深度遍历。
  2. Python 2.2 的新式类(new-style class)预计算。
  3. Python 2.3 的新式类的 C3 算法。它也是 Python 3 唯一支持的方式。

经典类和新式类:
Python 有两种类:经典类(classic class)和新式类(new-style class)。
两者的不同之处在于新式类继承自 object
在 Python 2.1 以前,经典类是唯一可用的形式;
Python 2.2 引入了新式类,使得类和内置类型更加统一;
在 Python 3 中,新式类是唯一支持的类。

1. 经典类(classic class)的深度遍历

MRO:从左至右的深度优先遍历,重复则保留第一个
获取MRO方式:inspect.getmro(objectn_ame)
在这里插入图片描述

>>> import inspect
>>> class A:
...     def show(self):
...         print "A.show()"
...
>>> class B(A): pass
>>> class C(A):
...     def show(self):
...         print "C.show()"
...
>>> class D(B, C): pass
>>> inspect.getmro(D)
(<class __main__.D at 0x105f0a6d0>, <class __main__.B at 0x105f0a600>, <class __main__.A at 0x105f0a668>, <class __main__.C at 0x105f0a738>)
>>> x = D()
>>> x.show()
A.show()

优点:

  • 对于简单的情况处理ok

缺点:

  • 对于菱形继承,处理效果欠佳;虽然 C.show() 是 A.show() 的更具体化版本(显示了更多的信息),但我们的 x.show() 没有调用它
  • 对于新式类而言,所有的类都继承自 object,所以「菱形继承」是非常普遍的现象,因此不可能采用这种 MRO 方式

2. Python 2.2 的新式类 MRO

对于经典类MRO存在的问题,Python 2.2 针对新式类提出了一种新的 MRO 计算方式:在定义类时就计算出该类的 MRO 并将其作为类的属性。
MRO:从左至右的深度优先遍历,但是如果遍历中出现重复的类,只保留最后一个。
获取MRO方式:直接通过 mro 属性获取类的 MRO。

新式类代码:

>>> class A(object):
...     def show(self):
...         print "A.show()"
...
>>> class B(A): pass
>>> class C(A):
...     def show(self):
...         print "C.show()"
...
>>> class D(B, C): pass
>>> D.__mro__
(<class '__main__.D'>, <class '__main__.B'>, <class '__main__.C'>, <class '__main__.A'>, <type 'object'>)
>>> x = D()
>>> x.show()
C.show()

新式类菱形继承
按照深度遍历,其顺序为 [D, B, A, object, C, A, object],重复类只保留最后一个,因此变为 [D, B, C, A, object]。

看起来完美解决了经典类【菱形继承】存在的问题啦。
稍等
再看个复杂点的例子

>>> class X(object): pass
>>> class Y(object): pass
>>> class A(X, Y): pass
>>> class B(Y, X): pass
>>> class C(A, B): pass


对于C类,

  1. 首先进行深度遍历,结果为 [C, A, X, object, Y, object, B, Y, object, X, object];
  2. 然后,只保留重复元素的最后一个,结果为 [C, A, B, Y, X, object]。
  3. Python 2.2 在实现该方法的时候进行了调整,使其更尊重基类中类出现的顺序,其实际结果为 [C, A, B, X, Y, object]。

问题是这样的结果是否合理?
来看看各个类的MRO:
A:[A, X, Y, object]
B:[B, Y, X, object]
C:[C, A, B, X, Y, object]

我们会发现,B 和 C 中 X、Y 的搜索顺序是相反的!
也就是说,当 B 被继承时,它本身的行为竟然也发生了改变,这很容易导致不易察觉的错误。
此外,即使把 C 搜索顺序中 X 和 Y 互换仍然不能解决问题,这时候它又会和 A 中的搜索顺序相矛盾。

事实上,不但上述特殊情况会出现问题,在其它情况下也可能出问题。其原因在于,上述继承关系违反了线性化的「 单调性原则 」。Michele Simionato对单调性的定义为:

A MRO is monotonic when the following is true: if C1 precedes C2 in the linearization of C, then C1 precedes C2 in the linearization of any subclass of C. Otherwise, the innocuous operation of deriving a new class could change the resolution order of methods, potentially introducing very subtle bugs.

也就是说,子类不能改变基类的方法搜索顺序。在 Python 2.2 的 MRO 算法中并不能保证这种单调性,它不会阻止程序员写出上述具有二义性的继承关系,因此很可能成为错误的根源。

除了单调性之外,Python 2.2 及 经典类的 MRO 也可能违反继承的「 局部优先级 」,具体例子可以参见官方文档。采用一种更好的 MRO 方式势在必行。

3. Python 2.3 的新式类的 C3 MRO算法

为解决 Python 2.2 中 MRO 所存在的问题,Python 2.3以后采用了 C3 方法来确定方法解析顺序。
你如果在 Python 2.3 以后版本里输入上述代码,就会产生一个异常,禁止创建具有二义性的继承关系:

>>> class C(A, B): pass
Traceback (most recent call last):
  File "<ipython-input-8-01bae83dc806>", line 1, in <module>
    class C(A, B): pass
TypeError: Error when calling the metaclass bases
    Cannot create a consistent method resolution
order (MRO) for bases X, Y

我们把类 C 的线性化(MRO)记为 L[C] = [C1, C2,…,CN]。
其中 C1 称为 L[C] 的头,其余元素 [C2,…,CN] 称为尾。

如果一个类 C 继承自基类 B1、B2、……、BN,那么我们可以根据以下两步计算出 L[C]:

  1. L[object] = [object]
  2. L[C(B1…BN)] = [C] + merge(L[B1]…L[BN], [B1]…[BN])

这里的关键在于 merge,其输入是一组列表,按照如下方式输出一个列表:

  1. 检查第一个列表的头元素(如 L[B1] 的头),记作 H。
  2. 若 H 未出现在其它列表的尾部,则将其输出,并将其从所有列表中删除,然后回到步骤1;否则,取出下一个列表的头部记作 H,继续该步骤。
  3. 重复上述步骤,直至列表为空或者不能再找出可以输出的元素。如果是前一种情况,则算法结束;如果是后一种情况,说明无法构建继承关系,Python 会抛出异常。

该方法有点类似于图的[拓扑排序](https://en.wikipedia.org/wiki/Topological_sorting),但它同时还考虑了基类的出现顺序。我们用 C3 分析一下刚才的例子。

object,X,Y 的线性化结果比较简单:

L[object] = [object]
L[X] = [X, object]
L[Y] = [Y, object]

A 的线性化计算如下:

L[A] = [A] + merge(L[X], L[Y], [X], [Y])      【1】
     = [A] + merge([X, object], [Y, object], [X], [Y])  【2】
     = [A, X] + merge([object], [Y, object], [Y])  【3】
     = [A, X, Y] + merge([object], [object]) 【4】
     = [A, X, Y, object] 【5】

注意第3步,merge([object], [Y, object], [Y]) 中首先输出的是 Y 而不是 object。
这是因为 object 虽然是第一个列表的头,但是它出现在了第二个列表的尾部(除了头部之外的部分)。
所以我们会跳过第一个列表,去检查第二个列表的头部,也就是 Y。Y 没有出现在其它列表的尾部,所以将其输出。

同理,B 的线性化结果为:
L[B] = [B, Y, X, object]
最后,我们看看 C 的线性化结果:

L[C] = [C] + merge(L[A], L[B], [A], [B])
     = [C] + merge([A, X, Y, object], [B, Y, X, object], [A], [B])
     = [C, A] + merge([X, Y, object], [B, Y, X, object], [B])
     = [C, A, B] + merge([X, Y, object], [Y, X, object])

到了最后一步我们没有办法继续计算下去 了:X 虽然是第一个列表的头,但是它出现在了第二个列表的尾部;Y 虽然是第二个列表的头,但是它出现在了第一个列表的尾部。
因此,我们无法构建一个没有二义性的继承关系,只能手工去解决(比如改变 B 基类中 X、Y 的顺序)。

别看答案,试着计算一下这个没有冲突的例子:

>>> class D(object): pass
>>> class E(object): pass
>>> class F(object): pass
>>> class B(D, E): pass
>>> class C(D, F): pass
>>> class A(B, C): pass
>>> A.__mro__

在这里插入图片描述
计算过程如下:

L[object] = [object]
L[D] = [D, object]
L[E] = [E, object]
L[F] = [F, object]
L[B] = [B, D, E, object]
L[C] = [C, D, F, object]
L[A] = [A] + merge(L[B], L[C], [B], [C])
     = [A] + merge([B, D, E, object], [C, D, F, object], [B], [C])
     = [A, B] + merge([D, E, object], [C, D, F, object], [C])
     = [A, B, C] + merge([D, E, object], [D, F, object])
     = [A, B, C, D] + merge([E, object], [F, object])
     = [A, B, C, D, E] + merge([object], [F, object])
     = [A, B, C, D, E, F] + merge([object], [object])
     = [A, B, C, D, E, F, object]

A.__mro__结果如下:

(<class '__main__.A'>, <class '__main__.B'>, <class '__main__.C'>, <class '__main__.D'>, <class '__main__.E'>, <class '__main__.F'>, <type 'object'>)

参考:
http://hanjianwei.com/2013/07/25/python-mro/

  • 2
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值