(一)题目
问题描述
给定 n n n个互不相同的数组成的集合 S S S以及正整数 k ≤ n k\leq n k≤n,试设计一个 O ( n ) \Omicron(n) O(n)时间算法找出 S S S中最接近 S S S的中位数的 k k k个数。
注意:此处“最接近”指数值大小接近,而不是排序位置接近。
(二)解答
算法思路
若已知能在线性时间内找到数组中第 k k k小的元素的算法,求解步骤如下:
1.通过该算法求数组的中位数;
2.计算数组中每个元素与中位数之差的绝对值并存放在绝对值数组;
3.通过该算法求绝对值数组中第 k k k小的数;
4.将原数组中与中位数之差的绝对值小于等于第 k k k小的绝对值的元素输出即为答案。
(注意:该算法要求绝对值数组中的元素不重复)
能在线性时间内找到数组中第 k k k小的元素的算法在另一篇博客中已有介绍,此处不再赘述,参考链接:
算法分析与设计-线性时间选择详解(通俗易懂,含图解,附源码)(c++)__Eliuak_的博客-CSDN博客
源代码(RandomizedSelect算法)
#include<iostream>
#include<cstdio>
#include<random>
using namespace std;
int n, k, len;
//将数组数组首元素a[p]作为基准数将数组分割
int Partition(int a[], int p, int r);
//交换两个元素
void Swap(int &a, int &b);
//在数组中随机选择一个数将数组分割
int RandomizedPartition(int a[], int p, int r);
//产生随机数
int Random(int x, int y);
//线性划分
int RandomizedSelect(int a[], int p, int r, int k);
int main()
{
cout<<"length n: ";
//输入数组长度n
cin>>n;
//输入数组
cout<<"array a: ";
int *a = new int[n];
for (int i = 0; i < n; ++i)
{
cin>>a[i];
}
cout<<"amount k: ";
//输入要找的接近中位数的个数k
cin>>k;
//计算整个数组的中位数
int mid = RandomizedSelect(a, 0, n - 1, (n + 1) / 2);
//计算数组中每个数与中位数之差的绝对值
int *d = new int[n];
for (int i = 0; i < n; ++i)
{
d[i] = abs(a[i] - mid);
}
//求绝对值数组中第k小的数
cout<<endl<<"answer: ";
int res = RandomizedSelect(d, 0, n - 1, k);
//用k作计数器,保证结果不会多输出
for (int i = 0; i < n; ++i)
{
//与中位数之差的绝对值小于第k小的绝对值的数都符合要求(这里要求绝对值不重复)
if (abs(a[i] - mid) < res)
{
cout<<a[i]<<' ';
k--;
}
}
for (int i = 0; i < n; ++i)
{
//与中位数之差的绝对值等于第k小的绝对值的数都符合要求(这里要求绝对值不重复)
if (abs(a[i] - mid) == res)
{
if (!k)
{
break;
}
cout<<a[i]<<' ';
k--;
}
}
cout<<endl;
delete []a;
delete []d;
return 0;
}
int Partition(int a[], int p, int r)
{
//i指向首元素,j指向尾元素的下一个元素
int i = p, j = r + 1;
//将首元素作为基准数
int x = a[p];
while (1)
{
//i从基准数右边的元素开始找,直到找到第一个大于等于基准数的元素
while (a[++i] < x && i < r);
//j从尾元素开始找,直到找到第一个小于等于基准数的元素
while (a[--j] > x);
//若i>=j,说明基准数的位置已找到,为j
if (i >= j)
{
break;
}
//交换两个元素,使得基准数左边的数均不大于它,右边的数均不小于它
Swap(a[i], a[j]);
}
//将基准数归位
a[p] = a[j];
a[j] = x;
//返回基准数的位置
return j;
}
void Swap(int &a, int &b)
{
int temp;
temp = a;
a = b;
b = temp;
}
int RandomizedPartition(int a[], int p, int r)
{
//在p和r之间找一个随机数
int i = Random(p, r);
Swap(a[i], a[p]);
return Partition(a, p, r);
}
int Random(int x, int y)
{
return x + rand() % (y - x);
}
int RandomizedSelect(int a[], int p, int r, int k)
{
//数组被分割成只剩下一个元素,该元素就是第k小的元素
if (p == r)
{
return a[p];
}
//在数组中随机找一个数将数组分割,分成小于等于该基准的数组和大于该基准的数组
int i = RandomizedPartition(a, p, r);
//求较小数数组的长度
len = i - p + 1;
//若较小数数组的长度小于等于k,说明第k小的元素在这个数组内,将其递归
if (k <= len)
{
return RandomizedSelect(a, p, i, k);
}
//否则,说明第k小的元素在较大数数组,将其递归
else
{
return RandomizedSelect(a, i + 1, r, k - len);
}
}
源代码(Select算法)
#include<iostream>
#include<cstdio>
#include<cmath>
using namespace std;
int n, k, len;
//选择排序
void SelectSort(int a[], int p, int r);
//将x作为基准数将数组分割,返回x的位置
int Partition(int a[], int p, int r, int x);
//交换两个元素
void Swap(int &a, int &b);
//找每组的中位数,返回中位数的位置i
int SearchMid(int a[], int p, int r);
//线性划分
int Select(int a[], int p, int r, int k);
int main()
{
cout<<"length n: ";
//输入数组长度n
cin>>n;
//输入数组
cout<<"array a: ";
int *a = new int[n];
for (int i = 0; i < n; ++i)
{
cin>>a[i];
}
cout<<"amount k: ";
//输入要找的接近中位数的个数k
cin>>k;
//计算整个数组的中位数
int mid = Select(a, 0, n - 1, (n + 1) / 2);
//计算数组中每个数与中位数之差的绝对值
int *d = new int[n];
for (int i = 0; i < n; ++i)
{
d[i] = abs(a[i] - mid);
}
//求绝对值数组中第k小的数
cout<<endl<<"answer: ";
int res = Select(d, 0, n - 1, k);
//用k作计数器,保证结果不会多输出
for (int i = 0; i < n; ++i)
{
//与中位数之差的绝对值小于第k小的绝对值的数都符合要求(这里要求绝对值不重复)
if (abs(a[i] - mid) < res)
{
cout<<a[i]<<' ';
k--;
}
}
for (int i = 0; i < n; ++i)
{
//与中位数之差的绝对值等于第k小的绝对值的数都符合要求(这里要求绝对值不重复)
if (abs(a[i] - mid) == res)
{
if (!k)
{
break;
}
cout<<a[i]<<' ';
k--;
}
}
cout<<endl;
delete []a;
delete []d;
return 0;
}
void SelectSort(int a[], int p, int r)
{
for (int i = p; i < r; ++i)
{
int index = i;
for (int j = i + 1; j <= r; ++j)
{
if (a[j] < a[index])
{
index = j;
}
}
Swap(a[i], a[index]);
}
}
int Partition(int a[], int p, int r, int x)
{
//i指向首元素的前一个位置,j指向尾元素的后一个位置
int i = p - 1, j = r + 1;
while (1)
{
//i从基准数右边的元素开始找,直到找到第一个大于等于基准数的元素
while (a[++i] < x && i < r);
//j从尾元素开始找,直到找到第一个小于等于基准数的元素
while (a[--j] > x && j > p);
//若i>=j,说明基准数的位置已找到,为j
if (i >= j)
{
break;
}
//交换两个元素,使得基准数左边的数均不大于它,右边的数均不小于它
Swap(a[i], a[j]);
}
//返回基准数的位置
return j;
}
void Swap(int &a, int &b)
{
int temp;
temp = a;
a = b;
b = temp;
}
int SearchMid(int a[], int p, int r)
{
//建立与数组a同等大小的数组b
int *b = new int[r - p + 1];
//用数组b存放数组a(注意此时b的首地址为0,而a的首地址为p)
for (int i = p; i <= r; ++i)
{
b[i - p] = a[i];
}
//将数组b排序,b[(r-p+1)/2]为中位数
SelectSort(b, 0, r - p);
for (int i = p; i <= r; ++i)
{
if (a[i] == b[(r - p + 1) / 2])
{
return i;
}
}
delete []b;
return 0;
}
int Select(int a[], int p, int r, int k)
{
if (r - p < 5)
{
SelectSort(a, p, r);
return a[p + k - 1];
}
//分成n/5组,每组5个,找到每组的中位数并将它放到数组首元素的位置
for (int i = 0; i <= (r - p - 4) / 5; ++i)
{
int mid = SearchMid(a, p + 5 * i, p + 5 * i + 4);
Swap(a[mid], a[p + i]);
}
//找到各组中位数的中位数
int x = Select(a, p, p + (r - p - 4) / 5, (r - p - 4) / 10 + 1);
//按照中位数划分
int i = Partition(a, p, r, x);
//求分割后较小数所在数组的长度
len = i - p + 1;
//若较小数数组的长度小于等于k,说明第k小的元素在这个数组内,将其递归
if (k <= len)
{
return Select(a, p, i, k);
}
//否则,说明第k小的元素在较大数数组,将其递归
else
{
return Select(a, i + 1, r, k - len);
}
}
结果示例
(三)总结
复杂度分析
由于找中位数,计算绝对值数组,找绝对值数组中第 k k k小的数,输出符合要求的 k k k个数的时间复杂度均为 O ( n ) \Omicron(n) O(n),因此求邻近中位数的 k k k个数的整个算法的时间复杂度同样为 O ( n ) \Omicron(n) O(n)。