1、MergeJoin(归并连接)
Merge Join中被连接的行必须在同一AMP中。如果被连接的行不在同一AMP中,Teradata会基于where子句中涉及的列来重新分布数据或者复制spool中的数据。
如果被连接的两个表有相同的primary index,则records(记录)会在相同的AMP中,就不需要重新分布记录了。
Merge Join在下列4中情况下会发生重分布(redistribution):
情况1:如果连接的列是UPI = UPI,则被连接的列在相同AMP中,不需要重分布。这是最快速高效的join策略
情况2:如果连接的列是UPI = Non Index column,则必须根据与第一个表的关系将第二个表中的记录重新分布到AMP
情况3:如果连接的列是Non Index column = Non Index column,则两个表都必须重新分布,使皮匹配的数据位于同一AMP上。由于两个表的完全重新分布遍历所有AMP,因此这种策略非常耗时。
情况4:对于发生在Primary Index上的join,如果参照表(join中的第二个表)很小,则这张表被拷贝到所有AMP上。
Nested Join