题目大意:给定多组数据,求每组数据中出现的逆序对个数。
给定n个数,要求这些数构成的逆序对的个数。除了用归并排序来求逆序对个数,还可以使用树状数组来求解。
树状数组求解的思路:开一个能大小为这些数的最大值的树状数组,并全部置0。从头到尾读入这些数,每读入一个数就更新树状数组,查看它前面比它小的已出现过的有多少个数sum,然后用当前位置减去该sum,就可以得到当前数导致的逆序对数了。把所有的加起来就是总的逆序对数。
题目中的数都是独一无二的,这些数最大值不超过999999999,但n最大只是500000。如果采用上面的思想,必然会导致空间的巨大浪费,而且由于内存的限制,我们也不可能开辟这么大的数组。因此可以采用一种称为“离散化”的方式,把原始的数映射为1-n一共n个数,这样就只需要500000个int类型的空间。
离散化的方式:
struct Node{int val, pos;};
Node node[500005];
int reflect[500005];
val存放原数组的元素,pos存放原始位置,即node[i].pos = i。
把这些结构体按照val的大小排序。
reflect数组存放离散化后的值,即reflect[node[i].pos] = i。
这样从头到尾读入reflect数组中的元素,即可以保持原来的大小关系,又可以节省大部分空间。
原始数据
Val 200 309 347 2 19
Pos 1 2 3 4 5
排序后
Val 2 19 200 309 347
Pos 4 5 1 2 3
离散化
ref 1 2 3 4 5
pos 4 5 1 2 3
所以离散化就是,排序后,从第一个位置上的数是最小的数,依次递增
for (int i = 1; i <= n; ++i) reflect[node[i].pos] = i; //离散化
如果求逆序对的数据中有相同的值,要特判这些相同的值
reflect[node[1].pos]=1; //包含重复数据的离散化
int tmp=1;
for (int i = 2; i <= n; ++i){
if(node[i].val==node[i-1].val)reflect[node[i].pos]=tmp;
else reflect[node[i].pos] = ++tmp;
}
访问使用的数据 等价与原始数据
ref 3 4 5 1 2
pos 1 2 3 4 5
来源; http://wenku.baidu.com/link?url=vGwOOyCdkIvedbwlUS5BxwSsMo793jIYnRxnl72OS4umklsyGIyRlkk8RDMwNnN6eikBNhaOljMbFqcIph0xpgw5HcRUwlkK_qzfFYpbzT7
算法详细解释:
1.解释为什么要有离散的这么一个过程?
刚开始以为999.999.999这么一个数字,对于int存储类型来说是足够了。
还有只有500000个数字,何必要离散化呢?
刚开始一直想不通,后来明白了,后面在运用树状数组操作的时候,
用到的树状数组C[i]是建立在一个有点像位存储的数组的基础之上的,
不是单纯的建立在输入数组之上。
比如输入一个9 1 0 5 4,那么C[i]树状数组的建立是在,
下标 0 1 2 3 4 5 6 7 8 9
数组 1 1 0 0 1 1 0 0 0 1
现在由于999999999这个数字相对于500000这个数字来说是很大的,
所以如果用数组位存储的话,那么需要999999999的空间来存储输入的数据。
这样是很浪费空间的,题目也是不允许的,所以这里想通过离散化操作,
使得离散化的结果可以更加的密集。
2. 离散之后,怎么使用离散后的结果数组来进行树状数组操作,计算出逆序数?
如果数据不是很大,可以一个个插入到树状数组中,
每插入一个数,统计比他小的数的个数,
对应的逆序为 i- getsum( aa[i] ),
其中 i为当前已经插入的数的个数,
getsum( aa[i] )为比 aa[i]小的数的个数,
i- sum( aa[i] ) 即比 aa[i]大的个数,即逆序的个数
但如果数据比较大,就必须采用离散化方法
假设输入的数组是9 1 0 5 4,离散后的结果REF[] = {5,2,1,4,3};
在离散结果中间结果的基础上,那么其计算逆序数的过程是这么一个过程。
1,输入5, 调用upDate(5,1),把第5位设置为1
1 2 3 4 5
0 0 0 0 1
计算1-5上比5小的数字存在么?这里用到了树状数组的getSum(5) = 1操作,
现在用输入的下标1 -getSum(5) = 0就可以得到对于5的逆序数为0。
2. 输入2,调用upDate(2, 1),把第2位设置为1
1 2 3 4 5
0 1 0 0 1
计算1-2上比2小的数字存在么?这里用到了树状数组的getSum(2) = 1操作,
现在用输入的下标2 -getSum(2) = 1就可以得到对于2的逆序数为1。
3. 输入1,调用upDate(1, 1),把第1位设置为1
1 2 3 4 5
1 1 0 0 1
计算1-1上比1小的数字存在么?这里用到了树状数组的getSum(1) = 1操作,
现在用输入的下标 3 -getSum(1) = 2就可以得到对于1的逆序数为2。
4. 输入4,调用upDate(4, 1),把第5位设置为1
1 2 3 4 5
1 1 0 1 1
计算1-4上比4小的数字存在么?这里用到了树状数组的getSum(4) = 3操作,
现在用输入的下标4 -getSum(4) = 1就可以得到对于4的逆序数为1。
5. 输入3,调用upDate(3, 1),把第3位设置为1
1 2 3 4 5
1 1 1 1 1
计算1-3上比3小的数字存在么?这里用到了树状数组的getSum(3) = 3操作,
现在用输入的下标5 -getSum(3) = 2就可以得到对于3的逆序数为2。
6. 0+1+2+1+2 = 6 这就是最后的逆序数
分析一下时间复杂度,首先用到快速排序,时间复杂度为O(NlogN),
后面是循环插入每一个数字,每次插入一个数字,分别调用一次upData()和getSum()
外循环N,upData()和getSum()时间O(logN) =>时间复杂度还是O(NlogN).
最后总的还是O(NlogN).
参考代码:
#include <iostream>
#include <cstring>
#include <cstdio>
#include <algorithm>
using namespace std;
const int N = 500005;
struct Node{
int val,pos;
};
Node node[N];
int c[N], reflect[N], n;
bool cmp(const Node& a, const Node& b){
return a.val < b.val;
}
int lowbit(int x){
return x & (-x);
}
void updata(int x){
while (x <= n){
c[x] += 1;
x += lowbit(x);
}
}
int getsum(int x){
int ret = 0;
while (x > 0){
ret += c[x];
x -= lowbit(x);
}
return ret;
}
int main(){
while (scanf("%d", &n) != EOF && n){
for (int i = 1; i <= n; ++i) {
scanf("%d", &node[i].val);
node[i].pos = i;
}
sort(node + 1, node + n + 1, cmp); //排序
for (int i = 1; i <= n; ++i) reflect[node[i].pos] = i; //离散化
for (int i = 1; i <= n; ++i) c[i] = 0; //初始化树状数组
long long ans = 0;
for (int i = 1; i <= n; ++i){
updata(reflect[i]);
ans += i - getsum(reflect[i]);
}
printf("%lld\n", ans);
}
return 0;
}