再议类型推导

最新推荐文章于 2023-10-13 21:10:38 发布

xtlisk

最新推荐文章于 2023-10-13 21:10:38 发布

阅读量1.4k

点赞数

文章标签：编程语言编译原理编译器算法优化

本文链接：https://blog.csdn.net/xtlisk/article/details/40379133

版权

在前面的理论部分，讲过静态类型推导，不过当时只是提到了概念，主要是为了证明这玩意是比较复杂的，之所以有必要再议一下，是因为这个对larva的效率还是挺重要的，事实上我只做了一个很简单的推导算法，就将larva在dhrystone上的速度提了一倍；另一方面也是之前讲的比较简略，再深入一下

前面讨论反向运算的时候提到，常见计算机的CPU只能直接处理整数和浮点计算（地址不在这次讨论范围），不考虑算法，一个程序在语言方面的提速，其实就是将抽象的计算过程编译为尽可能少的CPU指令，优化不能修改程序的原意，所以优化就等同于“少做多余的事”。比如就动态类型语言的设计而言，若直接实现，则一个很大的消耗是由于所有类型都是object的子类，基础类型也是

举个简单的例子，比如在larva中，计算a==b相当于a.op_eq(b)，从语法上讲，这是一个运算，于是直接实现的代码可能是：

LarObj op_eq(LarObj b)
{
    boolean b = ...; //根据具体类型实现计算过程，结果在b
    return b ? TRUE : FALSE; //TRUE和FALSE是内置的两个bool对象
}

由于a和b运行时可能是任意类型，而且编译期也只能将其指定为LarObj，所以类型是LarObj，问题在于这个返回值，首先，这个函数无论如何只会返回TRUE和FALSE，因此返回类型可以指定为LarObjBool
第二点就很重要，考虑“==”运算，在绝大多数情况下，这个运算是用于if、while判断，或判断的子表达式中，而LarObjBool这个类型我规定它不能参与数学计算（python中是可以的），如果按上面的实现，则if a==b就转成：

if (a.op_eq(b).op_bool())

也就是先计算，对返回的对象取其boolean值，根据上面，op_eq只返回两个对象，因此可以优化成这样的实现：

boolean op_eq(LarObj b)
{
    return ...; //直接返回计算结果
}
if (a.op_eq(b)) ...

这样一来就达到了优化的目的，如果判断语句很多，提速很明显
当然会引入一个问题，如果出现result=a==b这种语句怎么办呢，编译器会将其处理为：

result = a.op_eq(b) ? TRUE : FALSE;

虽然在这种情况下，会多一个判断，但相比上述原始的实现，少了一个方法调用，速度还是快很多的，更重要的是，bool运算的结果极少会赋给一个变量或参与计算，绝大多数情况都是用在if和while中，因此这个特殊处理是非常有价值的，类似的处理方式也在其他内置操作有体现，比如cmp、contain、len、hash之类的运算上
P.S.len和hash返回类型是int且参与计算，如果不做其他处理，则类似len(l)/2会被编译为：

(new LarObjInt(l.op_len())).op_div(CONST_INT_2)

这种情况下，限定这俩操作的返回值是没有什么意义的，但是如果结合类型推导，就可以直接编译为:

l.op_len() / 2

这个后面再说了

先扯这一堆，一是说明这个实现上的细节，二是指出在动态类型语言中类型方面有很大的优化空间，之前在静态类型推导一文中提到，动态类型语言无所谓推导，其实说得不合适，动态类型语言也是可以根据代码分析来确定部分变量类型的，像上面这个例子，虽然原则上所有变量和引用都是object型，但对具体的场景确定类型来提高效率，在写代码的人看来感知不到，并不违反原则

先看一个前面静态类型推导中的例子：

a = 123
a = "hello"

这个代码在静态类型语言中一般是不允许的，如果有推导，则会出错，因为a的类型是确定的，却用两种类型赋值，假设编译器以第一个赋值为准（类似C++的auto或golang的:=），可能会报错“a的类型是int，不允许将string赋值给a”
然而稍微改下这个例子：

class Z
class A extends Z
class B extends A
class C extends A
b = new B()
b = new C()

编译器看到第一个赋值，认为b的类型是B，然后在第二个赋值处报错，而程序员本身的意思是b的类型是A，然后先后将A的两个子类实例赋值给它，如果语言规定这种情况下需要对b做类型声明，或在前面写一个b=new A()，就显得太笨拙了

因此，前面讲的静态类型推导不完善，推导过程不是说找到一个赋值确定类型，然后检查其余，或检查所有赋值处的一致性，而是综合所有赋值操作，找到一个最合适的类型指派，比如上面的例子，b的类型经过推导应该是A或Z都可以，它们都是B和C的基类，但是最佳指派应该是A，再上面的例子，由于整数和字符串没有公共基类，所以编译器应该报错

然后回过头看动态类型语言中，还是以上面a的例子，在动态类型语言中，所有类型都是object的子类，因此由于a被分别赋值为整数和字符串，它应该是object类型，不应该报错。这里就再次看到了动静态类型体系的关系：动态类型是静态类型在“所有类型都是object的子类”这一条件下的特例

这里引入一个兼容的概念，假设一个类型A的对象（或值）可以不加转换地赋值给另一个类型B的变量，则称B兼容A，例如，基类兼容派生类，长整数兼容整数，等等
P.S.这两句放一起，容易让人产生“long是int的基类”的看法，这个说法有点奇怪，但就兼容性角度来说，是对的，int可看做是long的特化

对有些代码，类型推导可能不能从最简单的常量赋值开始，比如写出如下代码：
a = b
b = a
当然，如果进行数据流分析，单独这两行代码是有问题的，因为没有赋初值，不过就语法上没有错误，从代码分析只能知道a和b类型相同或兼容，编译器可能需要计算出它的一个最优指派

再复杂一些，考虑容器，比如list，假设我们将list的元素类型也做类型推导，情况跟变量类似，然而这样会跟之前一样引入递归的问题，比如：

func f(l):
    ...
    l.add(123)
    f([])
    ...
f([])

像之前的文章中说的，f看做一个模板，看到最后f的调用，构造一个f函数，参数类型是list<?>，然后分析这个f函数实例的代码才知道是list<int>，但是同时又引入了一个新的f函数实例，这个实例有可能跟原来的不同，于是推导过程就陷入无限循环
前面文章将这种情况的原因归为后续代码分析推导，但事实上，即便是C++的模板这种确定性推导也有这个问题，比如：

template <typename T>
void f(T t)
{
    vector<T> v;
    f(v);
}

这个模板，无论以什么类型的参数调用，都会陷入无限泛型定义，最终编译器会耗尽内存而失败，vs还限制了编译器的heap size，不至于造成很大后果，gcc貌似会一直吃内存到堆耗尽
然而类似的代码在java中就没有编译问题，因为java的泛型不是用代码扩展实现的，所以模板本身可以正常编译

再回到上述动态类型的list类型推导问题，如果只是规避无限递归，可以规定list跟代码相关，也就是说代码中每个“[]”作为一个列表，有固定的元素类型，而代码不扩展，这样一来，只要从一个“[]”开始，追踪它所有可能对元素做改变的地方即可

收集所有赋值（包括改变容器元素内容、函数调用参数传递等）的地方及所有表达式，可以构造一张关系图，因此类型推导问题就变成：找到对所有需要确定类型的元素的一个类型指派，使得关系图成立

很容易看出在动态类型体系下，上述问题有一个很简单的解：只需都指派object，就一定成立，不过这么干没啥意义。然而不幸的是，这个问题是一个CSP（约束可满足性问题）

CSP是指这样一种问题，有若干需要求解的元素，输入这些元素之间的约束，找到一个满足这些约束的解，且一般都要求在某种评估条件下最优，类似解方程，比如SAT，线性规划等，丢番图方程也算一种CSP

CSP通常都是NP-hard的，因此输入约束和要求解的元素很多的时候，找到一个最优解是无法操作的，一般来说有几种方案：
1 具体到实际面临的CSP问题，可能不是NP-hard，这需要结合问题特点找一个多项式算法
2 采用近似算法，找到一个尽量最优的解
3 在可接受范围内增加一些约束和条件，将其转为一个相对容易解决的问题（有多项式算法，或规模降低）
对于类型推导，我查了一些资料，一般而言这是一个NP-hard问题，对于动态类型语言的类型推导，我也不清楚是否存在多项式算法，因此在做larva的时候，采用了上述第三条方案，通过增加一些限制条件，放弃了完全推导，简化为一个很容易解决的问题，并且也有相对较好的性能提升