题目描述
请实现两个函数,分别用来序列化和反序列化二叉树
题目解析:题目的要求似乎不是太清晰,序列化的意思是指将一些特定的数据结构,变成有格式信息的字符串。例如对一个链表,可以将1->2->3->4->NULL序列化为"1,2,3,4"。对于序列化算法,必须支持反序列化,即在约定的格式下,可以将满足格式要求的字符串重新构造为原始的结构形式。实际上就是用序列来表示一棵二叉树,然后还可以根据这个序列重建二叉树。这里没有规定序列化的方式,不管序列化成什么字符串,只要能够还原重建二叉树即可。
解题思路:
根据前面的面试题重建二叉树,我们知道可以从前序遍历和中序遍历构造出一棵二叉树。受此启发,我们可以先把一棵二叉树序列化成一个前序遍历序列和一个中序序列的结合,然后再反序列化时通过这两个序列重构出原二叉树。
但是这个思路有两个缺点。一个缺点是该方法要求二叉树中不能用有数值重复的结点。另外只有当两个序列中所有数据都读出后才能开始反序列化。如果两个遍历序列的数据是从一个流里读出来的,那就可能需要等较长的时间。
实际上如果二叉树的序列化是从根结点开始的话,那么相应的反序列化在根结点的数值读出来的时候就可以开始了。因此我们可以根据前序遍历的顺序来序列化二叉树,因为前序遍历是从根结点开始的。当在遍历二叉树碰到 NULL 指针时,这些 NULL 指针序列化成一个特殊的字符(比如‘$’)。另外,结点的数值之间要用一个特殊字符(比如’,’)隔开。以下图中的二叉树为例:
1 1 2 / \ 3 2 3 4 / / \ 5 4 5 6
- 序列化:对于上图中的树,进行前序遍历时,先访问到1,然后2,然后4,4的左右子结点都为空,可以用一个特殊字符替代,譬如用$,所以上图中的二叉树前序遍历表示就是“1,2,4,$,$,$,3,5,$,$,6,$,$"。
- 反序列化:重建的时候,访问的第一个结点为根结点,接下来的数字是2,它是根结点的左子结点。接下来的是4,它是2的左子结点。然后遇到两个$,说明4的左右子结点都是NULL。接下来结点回退,访问4的父结点2,又是$,说明2的右子结点是NULL。再返回到根结点,这时候该建立它的右子结点了,下一个数值是3,说明3是根结点的右子结点,剩下的步骤和左子树部分类似。
二叉树的遍历做多了后,递归实现前序遍历和根据前序遍历得到的序列重建二叉树应该不难,这道题对我而言主要问题在于对输入流的控制,一直用的不太好,就不拿自己的代码出来误导人了,找了个别人的代码来看看。
代码
/*
struct TreeNode {
int val;
struct TreeNode *left;
struct TreeNode *right;
TreeNode(int x) :
val(x), left(NULL), right(NULL) {
}
};
*/
class Solution {
private:
TreeNode* decode(char *&str) {
if(*str=='#'){
str++;
return NULL;
}
int num = 0;
while(*str != ',')
num = num*10 + (*(str++)-'0');
str++;
TreeNode *root = new TreeNode(num);
root->left = decode(str);
root->right = decode(str);
return root;
}
public:
char* Serialize(TreeNode *root) {
if(!root) return "#";
string r = to_string(root->val);
r.push_back(',');
char *left = Serialize(root->left);
char *right = Serialize(root->right);
char *ret = new char[strlen(left) + strlen(right) + r.size()];
strcpy(ret, r.c_str());
strcat(ret, left);
strcat(ret, right);
return ret;
}
TreeNode* Deserialize(char *str) {
return decode(str);
}
};