PyPy为什么比CPython快？

最新推荐文章于 2024-09-19 08:38:11 发布

电影院秩序管理院院长

最新推荐文章于 2024-09-19 08:38:11 发布

阅读量588

点赞数

文章标签： python 开发语言

本文链接：https://blog.csdn.net/weixin_43445847/article/details/123527049

版权

def add(a,b):
    return a +ｂ

对于这个python代码　两种编译器分别做了两种处理

CPython 执行起来大概是这样（伪代码）：

if instance_has_method(x, '__add__') {
    return call(x, '__add__', y) // x.__add__ 里面又有一大堆针对不同类型的 y 的判断
} else if isinstance_has_method(super_class(x), '__add__' {
    return call(super_class, '__add__', y)
} else if isinstance(x, str) and isinstance(y, str) {
    return concat_str(x, y)
} else if isinstance(x, float) and isinstance(y, float) {
    return add_float(x, y)
} else if isinstance(x, int) and isinstance(y, int) {
    return add_int(x, y) 
} else ...

以此来完成Python 的动态类型　执行到这里还没完还得实现C语言的部分

实际上Python 里面的一个int 大概是个这样的结构体

struct {
    prev_gc_obj *obj
    next_gc_obj *obj
    type int
    value int
    ... other fields
}

然后每个int都是这样的结构体还是动态分配出来放在heap上的里面的value还不能变每次计算出来的结构体还要去heap上malloc 一个结构体 CPython每次重复这个过程

而PyPy执行的时候得益于JIT 第一次传入两个整数就生成两个整数相加的函数的C代码下次再传入两个整数时直接加载以及生成的方法当然比CPython快

但是JIt 本身也是有问题的编译本身需要花很多时间如果这个代码本来只执行一次需要1s 但是编译需要10s

PyPy 源代码文件分为两部分一部分完全是为了生成编译工具链另一部分是关键的解释器部分他是混有RPython的以及给工具链提供编译的普通Python的部分

实际编译步骤是先用CPyton 或别的Python解释器 import RPython的编译工具链

工具链是普通的Python 这个Python import 了RPython代码到内存里然后对RPython代码做静态分析和类型推导推导完的结果生成等价的C代码然后调用gcc编译生成本地diamagnetic 然后我们就得到一个可执行的pypy-c文件然后用pypy-c文件来执行开发者的python代码

而CPython 是两层Python

它直接用CPython调用PyPy.py 做自解释 CPython会直接把PyPy的RPython的代码当作普通Python代码执行