就地交换两个数是比较经典而且基础的算法之一。 我们要交换两个数字,通常的做法就创建一个中间变量,然后进行循环赋值,比如说下面的代码:
void Switch(int* p1, int* p2)
{
int tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
这种做法是最常见的一种交换两个数字的方法,但研究算法的人总是会提出比较诡异的问题,比如说在手持设备中,内存资源很宝贵,要求不开辟新的空间,就地完成交换工作。
我们来考虑一下,如果想要就地完成这个交换的工作,从哲学地角度思考这个问题,我们手头有两个变量,要存储两个的信息。我们将每个信息存储到一个单独的变量中,这是一种存储方式,但如果使用这种存储方式,我们是不可能完成就地交换的。那么我们需要考虑另外一种存储方式,用一个变量存储两个信息的集合,用另外一个变量存储任意一个信息,这种存储方式就可以完成交换的工作。
上面这段话很抽象,我们用为代码来表示
// 现在有两个变量a, b,我使得
a = [a,b] // a 等于ab两个信息的集合
b = b // b 还是 b
这种表示方法,我们存储了两个信息,但存储方式不一样,我们需要对信息进行提取,例如我们要a时,则
c = a 去除 b
如果还是不明白这种存储方式,那么我直接给出就地交换的算法:
void switch(int* p1, int* p2)
{
*p1 = *p1 + *p2; // 改变存储方式,使得*p1保存两个信息
*p2 = *p1 - *p2; // 取出 原来的 *p1 信息,存入 *p2 中
*p1 = *p1 - *p2; // 取出原来的 *p2 信息,存入 *p1 中
}
上面的代码看起来有点烦? 把指针去掉看吧:
int a = 1;
int b = 2;
a = a + b;
b = a - b;
a = a - b;
这个思路很巧妙,但也存在一定问题: 万一溢出了怎么办?
到目前为止,我们的答题思路是没错的,就是寻找另外一种数据存储的模式,用一个变量保存两条信息的集合,我们仍然需要采用这种模式解决这个问题,但原先的简单相加的模式是不行了,于是我们想到,集合两个整型数字,是否可以从其二进制表达方面来考虑?
我们可以使用位异或来存储集合信息。 用 1 和 0 来做简单的验证,看是否可以用异或的方式,存储信息的集合:
如果两个数是a = 1和b = 0,则:
集合 = 1
0 异或 集合 = 1
1 异或 集合 = 0
如果 a = 1 & b = 1
集合 = 0
1 异或 集合 = 1
如果 a = 0 & b = 0
集合 = 0
0 疑惑 集合 = 0
验证结果: 可以采用信息集合的方式存储
那么我们的交换代码可以变成:
int a = 10;
int b = 50;
a = a ^ b; // 构建集合
b = a ^ b; // 取出集合的另一个元素
a = a ^ b; // 取出集合的另一个元素
这种方式不用担心数据溢出,应该算是就地交换两个数的最佳解决方案了。
我在这篇文章里提到的两个数信息的集合,这个概念应该不是很准确,只是我算法功底有限,无法用比较精确的语言来表述我的想法,我觉得把这一类思想归为使用信息冗余来进行数据备份比较合适。
我记得在几年前,我的好朋友,国际非著名算法学家,国际著名大学博士后,2030年图灵奖获得者老卢先生就跟我聊过他的一个关于服务器上数据备份的想法。
他说,服务器上的数据很重要,如果硬盘损坏,会造成难以估量的损失,所以需要对硬盘数据进行备份,但如果我们对每一块硬盘都提供等价大小的空间进行备份的话,我们就需要两倍数量的硬盘以保证备份的完整,这种冗余是 100%。我们使用了100块硬盘就必须再拿出100块硬盘进行备份。但如果我们能够将100块硬盘上所有的数据异或一次,然后用一块硬盘存储起来,我们就可以使用一块硬盘对100块硬盘进行备份。
当然,具体将多少块硬盘的数据集合在一起,是需要进行概率计算的,因为如果有两块硬盘同时损坏,那么备份的数据就会失效。我们必须计算出多少块硬盘里,两块硬盘同时损坏的概率,小于使用100%冗余方法备份中,运行硬盘和备份硬盘同时损坏的概率。在计算出这个数量以后,我们即可使用这种备份的方式。
老卢的这种思路不可谓不神奇,因此也列在这里,供大家参考。
void Switch(int* p1, int* p2)
{
int tmp = *p1;
*p1 = *p2;
*p2 = tmp;
}
这种做法是最常见的一种交换两个数字的方法,但研究算法的人总是会提出比较诡异的问题,比如说在手持设备中,内存资源很宝贵,要求不开辟新的空间,就地完成交换工作。
我们来考虑一下,如果想要就地完成这个交换的工作,从哲学地角度思考这个问题,我们手头有两个变量,要存储两个的信息。我们将每个信息存储到一个单独的变量中,这是一种存储方式,但如果使用这种存储方式,我们是不可能完成就地交换的。那么我们需要考虑另外一种存储方式,用一个变量存储两个信息的集合,用另外一个变量存储任意一个信息,这种存储方式就可以完成交换的工作。
上面这段话很抽象,我们用为代码来表示
// 现在有两个变量a, b,我使得
a = [a,b] // a 等于ab两个信息的集合
b = b // b 还是 b
这种表示方法,我们存储了两个信息,但存储方式不一样,我们需要对信息进行提取,例如我们要a时,则
c = a 去除 b
如果还是不明白这种存储方式,那么我直接给出就地交换的算法:
void switch(int* p1, int* p2)
{
*p1 = *p1 + *p2; // 改变存储方式,使得*p1保存两个信息
*p2 = *p1 - *p2; // 取出 原来的 *p1 信息,存入 *p2 中
*p1 = *p1 - *p2; // 取出原来的 *p2 信息,存入 *p1 中
}
上面的代码看起来有点烦? 把指针去掉看吧:
int a = 1;
int b = 2;
a = a + b;
b = a - b;
a = a - b;
这个思路很巧妙,但也存在一定问题: 万一溢出了怎么办?
到目前为止,我们的答题思路是没错的,就是寻找另外一种数据存储的模式,用一个变量保存两条信息的集合,我们仍然需要采用这种模式解决这个问题,但原先的简单相加的模式是不行了,于是我们想到,集合两个整型数字,是否可以从其二进制表达方面来考虑?
我们可以使用位异或来存储集合信息。 用 1 和 0 来做简单的验证,看是否可以用异或的方式,存储信息的集合:
如果两个数是a = 1和b = 0,则:
集合 = 1
0 异或 集合 = 1
1 异或 集合 = 0
如果 a = 1 & b = 1
集合 = 0
1 异或 集合 = 1
如果 a = 0 & b = 0
集合 = 0
0 疑惑 集合 = 0
验证结果: 可以采用信息集合的方式存储
那么我们的交换代码可以变成:
int a = 10;
int b = 50;
a = a ^ b; // 构建集合
b = a ^ b; // 取出集合的另一个元素
a = a ^ b; // 取出集合的另一个元素
这种方式不用担心数据溢出,应该算是就地交换两个数的最佳解决方案了。
我在这篇文章里提到的两个数信息的集合,这个概念应该不是很准确,只是我算法功底有限,无法用比较精确的语言来表述我的想法,我觉得把这一类思想归为使用信息冗余来进行数据备份比较合适。
我记得在几年前,我的好朋友,国际非著名算法学家,国际著名大学博士后,2030年图灵奖获得者老卢先生就跟我聊过他的一个关于服务器上数据备份的想法。
他说,服务器上的数据很重要,如果硬盘损坏,会造成难以估量的损失,所以需要对硬盘数据进行备份,但如果我们对每一块硬盘都提供等价大小的空间进行备份的话,我们就需要两倍数量的硬盘以保证备份的完整,这种冗余是 100%。我们使用了100块硬盘就必须再拿出100块硬盘进行备份。但如果我们能够将100块硬盘上所有的数据异或一次,然后用一块硬盘存储起来,我们就可以使用一块硬盘对100块硬盘进行备份。
当然,具体将多少块硬盘的数据集合在一起,是需要进行概率计算的,因为如果有两块硬盘同时损坏,那么备份的数据就会失效。我们必须计算出多少块硬盘里,两块硬盘同时损坏的概率,小于使用100%冗余方法备份中,运行硬盘和备份硬盘同时损坏的概率。在计算出这个数量以后,我们即可使用这种备份的方式。
老卢的这种思路不可谓不神奇,因此也列在这里,供大家参考。