用户A推荐用户B来注册,用户B推荐用户C来注册。用户C的最终推荐人是用户A,用户B的最终推荐人也是用户A。如何利用递归来实现最终推荐人的寻找呢?
在数据库表中,可以记录两行数据,其中actor_id表示用户id,referrer_id表示推荐id。基于这个背景,问题是:给定一个用户id,如何查找到这个用户的“最终推荐人”?
递归是一种应用非常广泛的算法(或者称为编程技巧)。基本上所有的递归问题都可以用递推公式来表示。
递归需要满足三个条件:
- 一个问题的解可以分解为几个子问题的解
- 这个问题与分解后的子问题,除了数据规模不同,求解思路完全相同
- 存在递归终止条件
1.如何编写递归代码
写递归代码的关键是:写出递推公式,找到终止条件。
问题:假设这里有n个台阶,每次你可以跨过1个台阶或者是2个台阶,请问走完这n个台阶,有多少种走法呢?
根据第一步的走法将问题分为两类:
第一类是第一步走了1个台阶
第二类是第一步走了2个台阶
所以n个台阶的走法就等于第一步走了一个台阶,剩下n-1个台阶的走法,加上第一步走了2个台阶,剩下n-2个台阶的走法。
f(n) = f(n-1) + f(n-2)
然后确定终止条件:f(1) = 1 f(2) = 2
然后编写代码进行这个递推问题的求解。
2.递归代码要警惕堆栈溢出
堆栈溢出会造成系统性崩溃,后果非常严重。如果递归求解的数据规模很大,调用层次很深,一直压入栈,就会有堆栈溢出的风险。
通过限制递归调用的最大深度的方式来进行解决。但是这种做法不能完全解决问题,因为最大的允许的递归深度跟当前线程剩余的栈空间的大小有关,事先无法计算。如果实时计算,代码过于复杂,会影响代码的可读性。在最大深度比较小的时候,这种方法可行,否则就不是很实用。
3.递归代码要警惕重复计算
从图中可以看到,f(3)会被重复计算2次,f(2)会被重复计算4次。这就是重复计算问题。为了避免重复计算问题,我们可以通过 一个数据结构(比如散列表)来保存已经求解过的f(k)。当递归调用f(k)时,先看下是否已经求解过。如果是,就直接从散列表中取值返回,不需要重复计算。
4.如何用三行代码找到最终推荐人?
long findRootReferrerId(long actorId){
long referrerId = select referrer_id from [table] where actor_id = actorId;
if (referrerId == null) return actorId;
return indRootReferrerId(referrerId);
}