一棵树如下图所示:
假设要找到结点F和H的最低公共祖先。首先我们得判断A的子树中是否同时包含结点F和H,得到的结果为true。接着我们再先后判断A的两个子结点B和C的子树是不是同时包含F和H,结果是B的结果是true而C的结果是false。接下来我们再判断B的两个子结点D和E,发现这两个结点得到的结果都是false。于是B就是最后一个公共祖先。
当我们判断以结点A为根的树中是否含有结点F的时候,我们需要对D、E等结点遍历一遍;接下来判断以B为根的树中是否含有结点F的时候,我们还是需要对D、E等结点再遍历一遍。这样会对同一结点遍历多次,效率比较低。
这时候我们可以考虑使用两个链表分别保存从根结点到输入的两个结点的路径,然后把问题转换成两个链表的最后公共结点。
我们首先得到一条从根结点到树中某一结点的路径,这就要求在遍历的时候,有一个辅助内存来保存路径。比如我们用前序遍历的方法来得到从根结点到H的路径的过程是这样的:
(1)遍历到A,把A存放到路径中去,路径中只有一个结点A;
(2)遍历到B,把B存到路径中去,此时路径为A->B;
(3)遍历到D,把D存到路径中去,此时路径为A->B->D;
(4)遍历到F,把F存到路径中去,此时路径为A->B->D->F;
(5)F已经没有子结点了,因此这条路径不可能到达结点H。把F从路径中删除,变成A->B->D;
(6)遍历G。和结点F一样,这条路径也不能到达H。遍历完G之后,路径仍然是A->B->D;
(7)由于D的所有子结点都遍历过了,不可能到达结点H,因此D不在从A到H的路径中,把D从路径中删除,变成A->B;
(8)遍历E,把E加入到路径中,此时路径变成A->B->E;
(9)遍历H,已经到达目标结点,A->B->E就是从根结点开始到达H必须经过的路径。
同理,我们也可以得到从根结点开始到达F必须经过的路径是A->B->F。所以这两个路径的最后公共结点就是B。
为了得到从根结点开始到输入的两个结点的两条路径,需要遍历两次树,每遍历一次的时间复杂度是O(n)。得到的两条路径的长度在最差情况时是O(n),通常情况下两条路径的长度是O(log n)。
bool GetNodePath(TreeNode* pRoot, TreeNode* pNode, list<TreeNode*>& path)
{
if(pRoot == pNode)
return true;
path.push_back(pRoot);
bool found = false;
vector<TreeNode*>::iterator i = pRoot->m_vChildren.begin();
while(!found && i < pRoot->m_vChildren.end())
{
found = GetNodePath(*i, pNode, path);
++i;
}
if(!found)
path.pop_back();
return found;
}
TreeNode* GetLastCommonNode
(
const list<TreeNode*>& path1,
const list<TreeNode*>& path2
)
{
list<TreeNode*>::const_iterator iterator1 = path1.begin();
list<TreeNode*>::const_iterator iterator2 = path2.begin();
TreeNode* pLast = NULL;
while(iterator1 != path1.end() && iterator2 != path2.end())
{
if(*iterator1 == *iterator2)
pLast = *iterator1;
iterator1++;
iterator2++;
}
return pLast;
}
TreeNode* GetLastCommonParent(TreeNode* pRoot, TreeNode* pNode1, TreeNode* pNode2)
{
if(pRoot == NULL || pNode1 == NULL || pNode2 == NULL)
return NULL;
list<TreeNode*> path1;
GetNodePath(pRoot, pNode1, path1);
list<TreeNode*> path2;
GetNodePath(pRoot, pNode2, path2);
return GetLastCommonNode(path1, path2);
}