PostgreSQL 数据库分别采用了动态规划方法和遗传算法来选择最优的执行计划。动态规划方法需要遍历全部的解空间(有优化),它一定能够获得最优解,因此是我们首选的方法。遗传算法则只能尝试从局部最优解向全局最优解不断逼近,但由于遗传代际的数量的限制,最终可能产生的是局部最优解。这种方法在表比较多的时候被采用,因为在表比较多的时候,动态规划的解空间快速地膨胀,可能会导致查询性能的下降,遗传算法的复杂度则可以限制在一定的范围内。
动态规划方法
我们先来看一下 PostgreSQL 数据库是如何使用动态规划方法来选择最优解的,假设参与连接的有 3 个表以及它们上面分别有索引:
CREATE TABLE TEST_A(A INT, B INT, C INT, D INT);
CREATE TABLE TEST_B(A INT, B INT, C INT, D INT);
CREATE TABLE TEST_C(A INT, B INT, C INT, D INT);
INSERT INTO TEST_A SELECT I, I+100, I+200, I+300 FROM GENERATE_SERIES(1,100) i;
INSERT INTO TEST_B SELECT I, I+100, I+200, I+300 FROM GENERATE_SERIES(1,100) i;
INSERT INTO TEST_C SELECT I, I+100, I+200, I+300 FROM GENERATE_SERIES(1,100) i;
CREATE INDEX TEST_A_IDX ON TEST_A(A);
CREATE INDEX TEST_B_IDX ON TEST_B(A,B);
ANALYZE TEST_A;
ANALYZE TEST_B;
ANALYZE TEST_C;
我们来看这样一个示例的动态规划的过程&#