思路一:(map/哈希表)计数
小Y:啊,这个问题呀,很简单啊,我就给每个数字计数,最后看一下个数不就知道了吗?
我:那你想想“给每个数字计数”这个操作,是用什么数据结构来实现的呢?
小Y:C++里面的map呀……
我:那你算算复杂度是多少
小Y:每个数字的平均查找复杂度是O(log N)(注,map是用红黑树实现的),那就是O(N log N)呗
我:那我排个序,再线性扫一遍,也是O(N log N),有没有更快的?
小Y:更快的呀……它主要是查找的时候费时log N,想要更快的话,那就只有哈希了!对,哈希,虽然需要较多的空间来实现。
我:嗯嗯,但是哈希的话,你得花时间去找好的哈希函数之类的,还费空间,有没有既快又省空间的做法呢?
小Y:你怎么这么挑剔啊,哼,不理你了%>_<% heng
我:喂别走呀……(唉,程序员注孤生)
思路二:每次删除两个不同的数字
我:逗比,生气了?我告诉你个又快又省空间的算法吧?
小Y:谁要听啊,鸽吻~
我:T^T 555,每次把找到两个不同的数字,把它们删掉,最后剩下的数字就是要找的数字了。
小Y:为什么啊?哦哦,造了
我:嗯嗯,怎么样,厉害吧?
小Y:那你具体怎么实现?怎么每次都找到两个不同的数字,怎么删?如果遇到一串连续的数字呢?复杂度是多少?……
我:啊,删去,标记一下就好了。至于怎么找嘛,弄个左右指针,然后……
小Y:这么麻烦啊,你到底行不行,我要打游戏呢,别烦我~
:-O orz
Finally,不行也得行了
其实确实很简单,做个标记就好了,演示代码(演示包括了实现和演示)如下:
#include <stdio.h>
#include <ctime>
#include <cstdlib>
#include <vector>
using namespace std;
const int MAX = 97;
vector<int> gen(int size, int& key) {
srand(time(0));
vector<int> ans(size);
int count = 0;
key = rand() % MAX;
for (int i = 0; i < size; ++i) {
ans[i] = rand() % MAX;
if (ans[i] % 2 == 0) {
ans[i] = key;
++count;
}
}
for (int i = 0; i < size && count < (size+2)/2; ++i)
if (ans[i] != key) {
ans[i] = key;
++count;
}
return ans;
}
void display(const vector<int>& v) {
for (int i = 0; i < v.size(); ++i)
printf("%d ", v[i]);
printf("\n\n");
}
int findTheMostElement(const vector<int>& v) {
display(v);
printf("----------------\n");
int left = 0, right = 1, size = v.size();
vector<bool> flags(size, false);
while (right < size) {
while (left < size && flags[left])
++left;
if (left >= size)
break;
while (right < size && (flags[right] || v[right] == v[left]))
++right;
if (right >= size)
break;
flags[left] = flags[right] = true;
printf("left=%d, right=%d\n", left, right);
}
for (int i = left; i < size; ++i)
if (!flags[i])
return v[i];
printf("No fit???\n");
return -1;
}
int main() {
int key, size = 10;
vector<int> v = gen(size, key);
if (findTheMostElement(v) != key)
printf("Wrong algorithm...\n");
else
printf("You find it, which is %d\n", key);
return 0;
}
运行效果如下图所示:
不过对于处女座的朋友,会觉得上面的写法不优雅,是吧,我也这样觉得,(^o^)/~,有没有更好的写法呢?本人愚钝,只想到了这样,July的《编程之法》里有另外一种等价的写法,就是用两个变量,一个记录元素值E,一个叫做time的量(初始为0),每次time为0的时候,E的值就赋值为序列中的下一个值;time不为0的时候,挨个遍历过去,如果遇到和E相同的数字,就++time,否则–time,最后E的值就是要找的元素值。
哈哈,应该很容易看出为什么会等价吧?
这里卖个关子,就不证明了,有兴趣的朋友可以自行yy一下为什么~
直接贴代码(只贴功能代码,其它部分跟上面的一样,结构化代码的好处,233):
int findTheMostElement(const vector<int>& v) {
display(v);
printf("----------------\n");
int E, time = 0;
for (int i = 0; i < v.size(); ++i)
if (time == 0) {
E = v[i];
++time;
continue;
}
else
time += (v[i] == E) ? 1 : -1;
return E;
}
运行效果如下:
快乐的一天过去了,米娜桑早点休息~