Ultra-QuickSort
Time Limit: 7000MS | Memory Limit: 65536K | |
Total Submissions: 52967 | Accepted: 19434 |
Description
Ultra-QuickSort produces the output
Your task is to determine how many swap operations Ultra-QuickSort needs to perform in order to sort a given input sequence.
Input
Output
Sample Input
5 9 1 0 5 4 3 1 2 3 0
Sample Output
6 0
Source
题目意思:
有一组数,求升序排列需要交换多少次,即对给定的每组数逆序数。可以用选择排序、归并排序和树状数组的思想来考虑,但是选择排序会超时。
解题思路:
这里我们考虑用树状数组来解决。分两步,离散化和求逆序数。
①离散化
因为题目中给出的n < 500,000而0 ≤ a[i] ≤ 999,999,999,所以我们可以把输入的N个数a[i],按大小顺序分别映射到1~N。
例如 9 1 0 5 4 可以离散化映射为 5 2 1 4 3.
②求逆序数
“逆序数就是数中各位在它前面有多少个数比它大,求出这些元素个数之和。”
每输入一个数就更新一次c数组再判断一次当前比这个数大的数的个数。
说明:
i是当前已经插入的数字的个数;
num[i]是原序列中的数离散化后的各个数;
getsum(num[i])表示比num[i]小的数的个数,getsum(num[i])等于num[num[i]–lowbit(num[i])+1]+...+num[num[i]];
i-getsum(num[i])表示比num[i]大的数的个数,这就是逆序数。
Note:困扰了我好几个小时的就是为什么“getsum(num[i])表示比num[i]小的数的个数”?
想了很久,我的理解是这样的:
因为是依次插入,每次都做查询,所以肯定是与当前的数有关。c数组是对数组的一种求和统计,每次输入后需要更新,更新时把该数被包含在c数组里的数据全部加一,所以c[i]表示当前比i小的数的个数。
代码一:先更新再求和
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define MAXN 500005
int c[MAXN],n,num[MAXN];
struct Node
{
int val,no;
} data[MAXN];
bool cmp(Node a,Node b)
{
return a.val<b.val;
}
int lowbit(int x)
{
return x&(-x);
}
void update(int x,int v)
{
while(x<=n)
{
c[x]+=v;
x+=lowbit(x);
}
}
int getsum(int x)
{
int sum=0;
while(x)
{
sum+=c[x];
x-=lowbit(x);
}
return sum;
}
int main()
{
int i;
long long ans;
while(scanf("%d",&n),n)
{
memset(c,0,sizeof(c));
for(i=1; i<=n; i++)
{
scanf("%d",&data[i].val);
data[i].no=i;//保存每个数输入时的下标
}
sort(data+1,data+n+1,cmp);//对输入的序列排序
for(i=1; i<=n; i++)
{
//离散化,把n个点按大小映射到1~n
//data[i].no是数在原序列中的下标
num[data[i].no]=i;//离散下标表示
}
ans=0;
for(i=1; i<=n; i++)
{
//n是总数,num[i]是原序列中的数离散化后的各个数
//getsum(num[i])表示比num[i]小的数的个数
//getsum(num[i])等于num[num[i]–lowbit(num[i])+1]+...+num[num[i]]
update(num[i],1);
ans+=i-getsum(num[i]);
}
cout<<ans<<endl;
}
}
代码二:先求和再更新
#include<cstdio>
#include<cstring>
#include<iostream>
#include<algorithm>
using namespace std;
#define MAXN 500005
int c[MAXN],n,num[MAXN];
struct Node
{
int val,no;
} data[MAXN];
bool cmp(Node a,Node b)
{
return a.val<b.val;
}
int lowbit(int x)
{
return x&(-x);
}
void update(int x,int v)
{
while(x<=n)
{
c[x]+=v;
x+=lowbit(x);
}
}
int getsum(int x)
{
int sum=0;
while(x)
{
sum+=c[x];
x-=lowbit(x);
}
return sum;
}
int main()
{
int i;
long long ans;
while(scanf("%d",&n),n)
{
memset(c,0,sizeof(c));
for(i=0; i<n; i++)
{
scanf("%d",&data[i].val);
data[i].no=i;//保存每个数输入时的下标
}
sort(data,data+n,cmp);//对输入的序列排序
for(i=0; i<n; i++)
{
//离散化,把n个点按大小映射到1~n
//data[i].no是数在原序列中的下标
num[data[i].no]=i+1;//离散下标表示
}
ans=0;
for(i=0; i<n; i++)
{
//n是总数,num[i]是原序列中的数离散化后的各个数
//getsum(n)是数在原序列中的下标
//getsum(num[i])表示比num[i]小的数的个数
//getsum(num[i])等于num[num[i]–lowbit(num[i])+1]+...+num[num[i]]
ans+=(getsum(n)-getsum(num[i]));
update(num[i],1);
}
cout<<ans<<endl;
}
}
转载:
树状数组,具体的说是 离散化+树状数组。这也是学习树状数组的第一题.
算法的大体流程就是:
1.先对输入的数组离散化,使得各个元素比较接近,而不是离散的,
2.接着,运用树状数组的标准操作来累计数组的逆序数。
算法详细解释:
1.解释为什么要有离散的这么一个过程?
刚开始以为999.999.999这么一个数字,对于int存储类型来说是足够了。
还有只有500000个数字,何必要离散化呢?
刚开始一直想不通,后来明白了,后面在运用树状数组操作的时候,
用到的树状数组C[i]是建立在一个有点像位存储的数组的基础之上的,
不是单纯的建立在输入数组之上。
比如输入一个9 1 0 5 4,那么C[i]树状数组的建立是在,
下标 0 1 2 3 4 5 6 7 8 9
数组 1 1 0 0 1 1 0 0 0 1
现在由于999999999这个数字相对于500000这个数字来说是很大的,
所以如果用数组位存储的话,那么需要999999999的空间来存储输入的数据。
这样是很浪费空间的,题目也是不允许的,所以这里想通过离散化操作,
使得离散化的结果可以更加的密集。
2. 怎么对这个输入的数组进行离散操作?
离散化是一种常用的技巧,有时数据范围太大,可以用来放缩到我们能处理的范围;
因为其中需排序的数的范围0---999 999 999;显然数组不肯能这么大;
而N的最大范围是500 000;故给出的数一定可以与1.。。。N建立一个一一映射;
①当然用map可以建立,效率可能低点;
②这里用一个结构体
struct Node
{
int v,ord;
}p[510000];和一个数组a[510000];
其中v就是原输入的值,ord是下标;然后对结构体按v从小到大排序;
此时,v和结构体的下标就是一个一一对应关系,而且满足原来的大小关系;
for(i=1;i<=N;i++) a[p[i].ord]=i;
然后a数组就存储了原来所有的大小信息;
比如 9 1 0 5 4 ------- 离散后aa数组就是 5 2 1 4 3;
具体的过程可以自己用笔写写就好了。
3. 离散之后,怎么使用离散后的结果数组来进行树状数组操作,计算出逆序数?
如果数据不是很大, 可以一个个插入到树状数组中,
每插入一个数, 统计比他小的数的个数,
对应的逆序为 i- getsum( aa[i] ),
其中 i 为当前已经插入的数的个数,
getsum( aa[i] )为比 aa[i] 小的数的个数,
i- sum( aa[i] ) 即比 aa[i] 大的个数, 即逆序的个数
但如果数据比较大,就必须采用离散化方法
假设输入的数组是9 1 0 5 4, 离散后的结果aa[] = {5,2,1,4,3};
在离散结果中间结果的基础上,那么其计算逆序数的过程是这么一个过程。
1,输入5, 调用upDate(5, 1),把第5位设置为1
1 2 3 4 5
0 0 0 0 1
计算1-5上比5小的数字存在么? 这里用到了树状数组的getSum(5) = 1操作,
现在用输入的下标1 - getSum(5) = 0 就可以得到对于5的逆序数为0。
2. 输入2, 调用upDate(2, 1),把第2位设置为1
1 2 3 4 5
0 1 0 0 1
计算1-2上比2小的数字存在么? 这里用到了树状数组的getSum(2) = 1操作,
现在用输入的下标2 - getSum(2) = 1 就可以得到对于2的逆序数为1。
3. 输入1, 调用upDate(1, 1),把第1位设置为1
1 2 3 4 5
1 1 0 0 1
计算1-1上比1小的数字存在么? 这里用到了树状数组的getSum(1) = 1操作,
现在用输入的下标 3 - getSum(1) = 2 就可以得到对于1的逆序数为2。
4. 输入4, 调用upDate(4, 1),把第5位设置为1
1 2 3 4 5
1 1 0 1 1
计算1-4上比4小的数字存在么? 这里用到了树状数组的getSum(4) = 3操作,
现在用输入的下标4 - getSum(4) = 1 就可以得到对于4的逆序数为1。
5. 输入3, 调用upDate(3, 1),把第3位设置为1
1 2 3 4 5
1 1 1 1 1
计算1-3上比3小的数字存在么? 这里用到了树状数组的getSum(3) = 3操作,
现在用输入的下标5 - getSum(3) = 2 就可以得到对于3的逆序数为2。
6. 0+1+2+1+2 = 6 这就是最后的逆序数
分析一下时间复杂度,首先用到快速排序,时间复杂度为O(NlogN),
后面是循环插入每一个数字,每次插入一个数字,分别调用一次upData()和getSum()
外循环N, upData()和getSum()时间O(logN) => 时间复杂度还是O(NlogN).
最后总的还是O(NlogN).