【数据结构与算法精炼】LeetCode No.169 : Majority Element,由一道算法题想到的关于多数投票算法(Boyer-Moore Voting)的使用

引言

数据结构与算法,是程序员的内功修炼。甚至有开发者还提出了程序=数据结构+算法
少侠我之前参加校招的时候,也是凭借在手撕代码环节出色的算法解题思路获得面试官的称赞并击败众多竞争者最后拿到字节跳动、搜狐等大厂的offer。
为了保持算法心经的日臻纯熟,我暗下决心,决定开始写互联网数据结构与算法相关的文章,希望能帮助各位读者在以后的手撕代码中游刃有余,对面试官进行360°的反击,让一同面试的同僚瞠目结舌,疯狂收割互联网大厂offer!
文章中虽然应用了夸张的修辞手法,但我们应该始终保持一颗谦逊的心。希望和大家怀着虚怀若谷的心态,共同学习进步。

问题描述

Given an array of size n, find the majority element. The majority element is the element that appears more than ⌊ n/2 ⌋ times.

You may assume that the array is non-empty and the majority element always exist in the array.

Example 1:

Input: [3,2,3]
Output: 3

Example 2:

Input: [2,2,1,1,1,2,2]
Output: 2

问题分析

这道题目题意很清晰:给定一整型数组,找到数组中出现次数大于数组长度一半的那个数字
解读了题意之后,聪明的你是否立即有了思路、跃跃欲试呢?
在这里插入图片描述
对嘛,数组中有一半以上的数字都是它,不是排序之后索引在中间的那个数肯定就是所求了么,于是解法一呼之欲出,两行代码搞定。

解法一:Sorting

class Solution {
    public int majorityElement(int[] nums) {
        Arrays.sort(nums);
   		return nums[nums.length/2];
    }
}

算法的时间复杂度O(nlog(n)),空间复杂度O(1)。性能较好。

当写到这里,你是不是还在自我陶醉,洋洋自得呢,快醒醒,这是大家都能想到的解法,而且是直接调用的数组工具类方法,难以在笔试中体现自我水平,想要从千百竞争者中脱颖而出,怎么能没有点东西呢?解法一只是为了抛砖引玉,解法二的多数投票算法才是本文的重点。

在这里插入图片描述

解法二:Boyer-Moore voting algorithm

1 Boyer-Moore 算法实现原理
Boyer-Moore需要记录两个值:候选节点candidate和count,核心在于要对给定数组进行两趟扫描。第一趟扫描我们得到一个候选节点candidate,第二趟扫描我们判断candidate出现的次数是否满足要求。

记录的值的初始化:
candidate,初值可以为任何数,这里可以就用数组的第一个元素;
count,初值为0

之后对于数组中每一个元素,首先判断count是否为0,若为0,则把candidate设置为当前元素。之后判断candidate是否与当前元素相等,若相等则count+=1,否则count-=1。

在第一趟扫描结束后,如果数组中存在多数元素,那么candidate即为其值,如果原数组不存在多数元素,则candidate的值没有意义。所以需要第二趟扫描来统计candidate出现的次数来判断其是否为多数元素。

这里,我们就用[1,2,2,1,1,2,2]这样一个数组为例演示Boyer-Moore算法的原理(通过观察我们知道2是多数元素)。算法流程如下图所示:
在这里插入图片描述按照上述流程,运行的结果如下图所示:

索引i0123456
nums[i]1221122
candidate1122112
count1010101

如上表所示,首先,candidate被设置为第一个元素1,count也变成1,由于1不是多数元素,所以当扫描到数组某个位置时,count一定会减为0。在本例中,当扫描到第二个位置时,count变成0。实际上cadidate的取值永远受上一步的count值决定。最后candidate=2(如果数组中存在多数元素,那么candidate即为其值,如果原数组不存在多数元素,则candidate的值没有意义。所以需要第二趟扫描来统计candidate出现的次数来判断其是否为多数元素)。

当count变成0时,对于每一个出现的1,我们都用一个0与其进行抵消,所以我们消耗掉了与其一样多的0,而0是多数元素,这意味着当扫描到第四个位置时,我们已经最大程度的消耗掉了多数元素。然而,对于数组从第五个位置开始的剩余部分,0依然是其中的多数元素(注意,多数元素出现次数大于⌊ n/2 ⌋,而我们扫描过的部分中多数元素只占一般,那剩余部分中多数元素必然还是那个数字)。如果之前用于抵消的元素中存在非多数元素,那么数组剩余部分包含的多数元素就更多了。
类似的,假设第一个数字就是多数元素,那么当count减为0时,我们消耗掉了与多数元素一样多的非多数元素,那么同样道理,数组剩余部分中的多数元素数值不变。
这两种情况证明了关键的一点:数组中从candidate被赋值到count减到0的那一段可以被去除,余下部分的多数元素依然是原数组的多数元素。我们可以不断重复这个过程,直到扫描到数组尾部,那么count必然会大于0,而且这个count对应的candinate就是原数组的多数元素。

2 Boyer-Moore 算法扩展:分布式应用
Boyer-Moore还有一个优点,那就是可以使用并行算法实现。
基本思想为对原数组采用分治的方法,把数组划分成很多段(每段大小可以不相同),在每段中计算出candidate-count二元组,然后得到最终结果。

举个例子,原数组为[1,1,0,1,1,0,1,0,0]
划分1:
[1,1,0,1,1] –> (candidate,count)=(1,3)
划分2:
[0,1,0,0] –> (candidate,count)=(0,2)
根据(1,3)和(0,2)投票结果可得,原数组的多数元素为1。

3 代码清单
通过上面的介绍,希望大家对Boyer-Moore有个清晰的认知,然后结合本题给出利用Boyer-Moore算法的解答,附程序清单:

class Solution {
    public int majorityElement(int[] nums) {
       int count = 0, res = 0;
        for (int num : nums) {
            if (count == 0) {
                res = num;
            }
            if (num != res) {
                count--;
            } else {
                count++;
            }
        }
        return res;
    }
}

当然本题还可以用HashMap解答,这里不做赘述。HashMap的原理传送门↓
【Java基础】HashMap底层实现原理 附源码分析及面试题,带你深入Java集合

小结

数据结构与算法,在实际开发中应用的可能并不多,但是掌握好这些知识点在面试、自我提升、对项目的认知是大有裨益的。优秀的算法不仅看着顺眼,用起来也是真香。数据结构与算法就好比是程序员的内功修炼,没有好的内功加持,再厉害的外家功夫也是花里胡哨。

点点关注,不会迷路

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值