关键点:
- 给定的数组总是存在多数元素。
- 出现次数大于 ⌊ n / 2 ⌋ \lfloor n/2\rfloor ⌊n/2⌋
说明下面这种情况不会出现在测试用例中:
[3,3,3,2,2,2,4] 或 [3,3,3,2,2,2]
也就是刚好有2个频率等于 ⌊ n / 2 ⌋ \lfloor n/2\rfloor ⌊n/2⌋ 的元素
按照进阶要求,设计一个时间复杂度为 O(n)、空间复杂度为 O(1) 的算法,可以使用摩尔投票算法(Boyer-Moore Voting Algorithm)来解决这个问题。
摩尔投票算法
通俗地理解,这是一场战斗游戏,游戏设定战斗结束时必定有且只有1个存活者(candidate
) ,最终返回的多数元素相当于存活者。战斗开始时(count==0
) ,我们先把第一个元素设置为存活者,并且给第一个元素赋予初始生命值1滴血,之后的循环过程相当于是战斗过程,只要碰见一个与当前存活者相同的元素,无需战斗,就给他生命值+1滴血(count += 1
),只要碰见一个和当前存活者不同的元素就需要战斗,战斗的结果就是消耗1滴血(count += -1
),只要当前的 count
不为 0,当前这个存活者就还“活着”,不会被更换,直到最后,战斗结束时,必然会有一个最终的存活者,这个存活者就是多数元素。
这个“活着”的概念可以理解为 candidate
元素仍然有足够的力量继续和其他不同的元素对抗或抵消。
C++ 代码实现:
#include <vector>
class Solution {
public:
int majorityElement(std::vector<int>& nums) {
//初始化计数器和候选者
int count = 0;
int candidate = 0;
// 摩尔投票算法
for (int num : nums) {
//首先,设置或更换 candidate(在计数器为 0 时)。
//如果是第一个元素则是设置,否则是被抵消完之后的更新
if (count == 0) {
candidate = num;
}
//然后,根据当前元素是否与当前候选者相同对计数器进行更新
count += (num == candidate) ? 1 : -1;
}
//循环结束,返回多数元素
return candidate;
}
};
刚进入for
循环时,变量 count
的值并非是当前 candidate
元素的总出现次数,而是当前循环步骤中当前 candidate
元素经过抵消后的出现次数。
当我们遇到一个与当前 candidate
不相同的元素时,count
减 1 是因为这些不同的元素可能代表着一个和 candidate
具有相同频率的另一类元素。因此,我们可以将当前的 candidate
和这个不同的元素看作是一对“相互抵消”的元素。
candidate 变量存储当前的候选元素。
具体过程可以这样理解:
- 当我们遇到与
candidate
相同的元素时,count
增加,表示它的力量增强。 - 当我们遇到与
candidate
不同的元素时,count
减少,表示它与这个不同元素互相抵消了一部分力量。 - 只有当
count
减少到 0 时,表示当前的candidate
被完全抵消掉了,它已经没有足够的力量继续作为候选元素,此时我们需要选择一个新的元素作为新的candidate
。
所以,只要 count
不为 0,当前的 candidate
还在“战斗”,它还是有可能是多数元素,只有当它被完全抵消(count = 0
)时,才会更换新的候选者。
这个“抵消战斗”的机制确保了多数元素(出现次数超过一半的那个元素)在整个数组遍历过程中会存活下来,并最终成为剩下的那个“胜者”。
count == 0
的可能情况
当前元素是数组的第一个元素时 count
为 0 外,还有另一种情况会导致计数为 0,即 候选元素和其他不同元素相互抵消 的过程中。
具体来说,当候选元素的计数减少到 0 时,说明之前的候选元素已经被后续元素抵消完了(遇到了和候选元素出现次数一样多的与候选元素不相同的元素)。在这种情况下,算法认为当前的候选元素不再是有效的多数元素,因此需要选择下一个未抵消的元素作为新的候选者。这发生的场景通常是:
-
候选元素的频率和非候选元素频率相同:如果数组中存在的元素并不是立即连续重复的,当前候选元素可能会逐渐被其他元素的不同值抵消,最终
count
变为 0。例如[3,2,3,4,3,6,3]
,count
的变化情况是[1,0,1,0,1,0,1]
,在经过元素 6 的循环步骤之后,count == 0
,由于题目描述必定存在多数元素,所以最后一个元素必定是 3。经过最后一次循环步骤之后,count == 1
-
当前候选元素遇到了足够多的与它不同的元素:当某一个候选元素不断被与它不同的元素抵消时,
count
逐渐减少到 0,此时下一个未抵消的元素会成为新的候选者。例如[3,3,3,1,4,7,3]
,count
的变化情况是[1,2,3,2,1,0,1]
,在经过元素 7 的循环步骤之后,count == 0
,同样,由于题目描述必定存在多数元素,所以最后一个元素必定是 3。经过最后一次循环步骤之后,count == 1
这个算法的时间复杂度是 O(n),因为我们只需要遍历一次数组,空间复杂度是 O(1),因为我们只使用了常量级别的额外空间。