第九章 还能更好吗?——寻找多数元素问题
问题:假如现在有一个序列,已知其中一个数的此书超过50%,请找出这个数。比如3、3、1、1、3、2、3中,出现次数超过50%的数是3。
答:
方法1:两两比较,分别记录数字的出现次数,2个for循环就可以解决。时间复杂度O(N^2)。
方法2:排序后再重头到尾扫一遍,用一个count来统计每个数出现的次数,并再用一个变量max来更新count的最大值。排序可以用堆排序或者快排,时间复杂度O(NlogN)。
方法3:排序结束后可以不扫,如果这个数出现的次数大于50%的话,排序之后就应该就是位于n/2位置的那个数。
方法4:用一个数组来记录每个数出现的次数,就是类似桶排序的方法,数组中最大值的下标就是出现次数超过50%的数。时间复杂度和空间复杂度都是O(M+N)。如果数的大小分布跨度很大,比如1,10000,1000000,这样会浪费空间,可以采用离散化解决,比如1对应1,2对应10000,3对应1000000。
方法5:选择一个数作为划分起点,然后用类似快速排序的方法将小于它的移到左边,大于它的移到右边,这样就将所有的数划分为两部分,此时,划分点所在位置为k。如果k>n/2,那么继续用同样的方法在左边部分查找;如果k<n/2就在右边不认查找;k=n/2那么就是这个数。这样比之前的快速排序的方法要快一些,估计近似于O(N)。
方法6:“寻找多元素问题”,我们很容易的看出来,在一个序列中如果去掉2个不同的元素,那么原序列中的出现次数超过50%的数,在新的序列中还是超过50%,因此我们只要按照序列依次扫描,先把A[0]赋值给c,增加个计数器,count = 1;然后向右扫描,如果跟c相同,则count++,不同,那么count --,这个真是我们从上面那个结论里得出的,一旦count == 0了,把c赋值为A[i+1],count = 1;,重复该过程,直到结束,这个时候,c就是那个超过50%的数。遍历一遍,时间复杂度为O(N)。
学习算法需要多思考!!!学习算法不能一直学学学,要经常停下来总结与回顾,比较算法的应用场景以及可以解决的问题,比较同一问题采用不同算法的性能。
题目是做不完的,算法是复杂多变的。我需要多练习思考问题的方式,而不是一味的多学新知识。
——配图来源于《啊哈!算法》第九章