//3、 一个长度未知的巨型向量分布在 n 台机器上, 如何快速找到(近似)中位数?
1、如果内存足够的情况下,可以取出n台机器上的所有数据,利用快速排序算法将所有数据
排序,取中位值。快速排序算法如下。
第一种情况模拟1000000条数据,进行快排取中位值。
2、如果内存不够,可以分别对每台机器上的数据用快速排序取中位值,然后保存n条结果,最
后对n个结果进行快排,取中位值,近似为全局的中位值。
第二种情况模拟100个机器,每个机器上有1000000条数据。
*/
//快排
inline void quick(vector<int>& all, int left, int right) {
int jizhun, i, j;
if (left > right)return;//不合逻辑
jizhun = all[left];//找到基准值
i = left;//左右指针
j = right;
while (i != j) {
while (jizhun <= all[j] && i < j)j--;//从右至左找到小于基准值的
while (jizhun >= all[i] && i < j)i++;//从左至右找到大于基准值的
if (i < j)swap(all[i], all[j]);//找到后交换,使基准值左边的值小于他,右边的大于他。
}
all[left] = all[i];//把基准值放到适当的位置,符合上面的注释
all[i] = jizhun;
quick(all, left, i - 1);//左右分治
quick(all, i + 1, right);
}
//快排重载,比较float
inline void quick(vector<float>& all, int left, int right) {
int i, j;
if (left > right)return;//不合逻辑
float jizhun = all[left];//找到基准值
i = left;//左右指针
j = right;
while (i != j) {
while (jizhun <= all[j] && i < j)j--;//从右至左找到小于基准值的
while (jizhun >= all[i] && i < j)i++;//从左至右找到大于基准值的
if (i < j)swap(all[i], all[j]);//找到后交换,使基准值左边的值小于他,右边的大于他。
}
all[left] = all[i];//把基准值放到适当的位置,符合上面的注释
all[i] = jizhun;
quick(all, left, i - 1);//左右分治
quick(all, i + 1, right);
}
void firstCase() {
long long len = 1000000;
vector<int>allNums(len);
for (int i = 0; i < 1000000; i++) {
allNums[i] = i;
}
random_shuffle(begin(allNums), end(allNums));
int length = allNums.size();
quick(allNums, 0, length - 1);
if (length % 2)cout << allNums[length / 2] << endl;
else printf("%.2f\n", (allNums[length / 2] + allNums[length / 2 - 1]) / 2.0);
}
void secondCase() {
long long len = 1000000;
int n = 100;
vector<vector<int>>ALL(n, vector<int>(len));
for (int i = 0; i < n; i++) {
vector<int>allNums(len);
for (int j = len * i; j < len * i + len - 1; j++) {
allNums[j - len * i] = j;
}
random_shuffle(begin(allNums), end(allNums));
ALL[i] = allNums;
}
vector<float>ans(n);
for (int i = 0; i < n; i++) {
vector<int>temp = ALL[i];
int length = temp.size();
quick(temp, 0, length - 1);
if (length % 2)ans[i] = temp[length / 2];
else ans[i] = (temp[length / 2] + temp[length / 2 - 1]) / 2.0;
}
int length = ans.size();
quick(ans, 0, length - 1);
if (length % 2)cout << ans[length / 2] << endl;
else printf("%.2f\n", (ans[length / 2] + ans[length / 2 - 1]) / 2.0);
}
int main() {
cout << "第一种情况:" << endl;
firstCase();
cout << "第二种情况:" << endl;
secondCase();
return 0;
}