题目描述
在数组中的两个数字,如果前面一个数字大于后面的数字,则这两个数字组成一个逆序对。输入一个数组,求出这个数组中的逆序对的总数P。并将P对1000000007取模的结果输出。 即输出P%1000000007
输入描述:
题目保证输入的数组中没有的相同的数字
数据范围:
对于%50的数据,size<=10^4
对于%75的数据,size<=10^5
对于%100的数据,size<=2*10^5
示例1
输入
1,2,3,4,5,6,7,0
输出
7
解题思路
1 顺序扫描
每扫描到一个数组的时候,逐个比较该数字和它后面的数字的大小。如果后面的数字比它小,则这两个数字就组成了一个逆序对。假设数组中含有n个数字。由于每个数字都要和O(n)这个数字比较,因此这个算法的时间复杂度为O(n^2)。
2 归并排序(分治算法)
我们以数组{7,5,6,4}为例来分析统计逆序对的过程。每次扫描到一个数字的时候,我们不拿ta和后面的每一个数字作比较,否则时间复杂度就是O(n^2),因此我们可以考虑先比较两个相邻的数字。
(a) 把长度为4的数组分解成两个长度为2的子数组;
(b) 把长度为2的数组分解成两个成都为1的子数组;
(c) 把长度为1的子数组 合并、排序并统计逆序对 ;
(d) 把长度为2的子数组合并、排序,并统计逆序对;
在上图(a)和(b)中,我们先把数组分解成两个长度为2的子数组,再把这两个子数组分别拆成两个长度为1的子数组。接下来一边合并相邻的子数组,一边统计逆序对的数目。在第一对长度为1的子数组{7}、{5}中7大于5,因此(7,5)组成一个逆序对。同样在第二对长度为1的子数组{6}、{4}中也有逆序对(6,4)。由于我们已经统计了这两对子数组内部的逆序对,因此需要把这两对子数组 排序 如上图(c)所示, 以免在以后的统计过程中再重复统计。
接下来我们统计两个长度为2的子数组子数组之间的逆序对。合并子数组并统计逆序对的过程如下图如下图所示。
我们先用两个指针分别指向两个子数组的末尾,并每次比较两个指针指向的数字。如果第一个子数组中的数字大于第二个数组中的数字,则构成逆序对,并且逆序对的数目等于第二个子数组中剩余数字的个数,如下图(a)和(c)所示。如果第一个数组的数字小于或等于第二个数组中的数字,则不构成逆序对,如图b所示。每一次比较的时候,我们都把较大的数字从后面往前复制到一个辅助数组中,确保辅助数组(记为copy) 中的数字是递增排序的。在把较大的数字复制到辅助数组之后,把对应的指针向前移动一位,接下来进行下一轮比较。
过程:先把数组分割成子数组,先统计出子数组内部的逆序对的数目,然后再统计出两个相邻子数组之间的逆序对的数目。
class Solution {
public:
int InversePairs(vector<int> data) {
int len = data.size();
if(!len) return 0;
vector<int> copy;
for(int i=0; i<len; ++i) copy.push_back(data[i]);
long long count = InversePairsCore(data, copy, 0, len-1);
return count%1000000007;
}
long long InversePairsCore(vector<int> &data, vector<int> ©, int start, int end) {
if(start == end) {
copy[start] = data[start];
return 0;
}
int len = (end-start)/2, mid = start+len, midn = mid+1;
long long left = InversePairsCore(copy, data, start, mid);
long long right = InversePairsCore(copy, data, midn, end);
int i = mid, j = end, idxc = end;
long long count = 0;
while(i>=start && j>=midn) {
if(data[i] > data[j]) {
copy[idxc--] = data[i--];
count += j-mid;
} else copy[idxc--] = data[j--];
}
for(;i>=start;--i) copy[idxc--] = data[i];
for(;j>=midn;--j) copy[idxc--] = data[j];
return left+right+count;
}
};
交换copy和data是因为:
1.在每次的操作中,数值的比较都是采用当前传入函数中第一项,也就是data;比较的结果都存放到copy中;也就意味着此时copy中是经过此次调用的结果。
2.从最底层返回时,进入了(start == end)的情形,data 和 copy 完全没有修改,此时copy和data还是一样的。
3.进入倒数第二层时,程序进入上图17行以后部分,copy是部分排序后的新数组,data是旧数组。注意这里都是传值的调用,数组都是直接修改的。
倒数第二层使用的copy其实是倒数第三层中的data,这就确保了倒数第三层进入17行以后时,数据比较使用的data是最新排序的数组。
4. 倒数第三层将排序的结果存入copy中。程序在倒数第四层进入17行后,使用的data数组为刚刚倒数第三层中的最新排序的copy.
5. 也就是说,在每次程序进入17行时,此时的data是最新的排序结果,copy是次新的结果。
在最后一次进入17行以后时,copy为完整排序后的结果,data是次新的结果。
然而这里第一个类内函数调用第二个函数时,data和copy的顺序没有改变,所以最后结果应该copy是完整排序的结果.data是差一步完成排序的结果。以输入[7,5,6,4], 最后的结果copy[4,5,6,7], data[5,7,4,6].
2 树状数组
(1)离散化输入数据,目的是确保每一个元素能够作为树状数组的下标;
(2)设离散化之后的数据数组为b。从后向前枚举b[i],如果b[i]>1,使用树状数组的求出[i+1,n]区间内值域在[1,b[i]-1]区间的元素个数,累加到计数器上。然后,在树状数组的b[i]位置加1,表示值为b[i]的元素多了一个。
#define MAXN 200010
typedef long long LL;
LL bit[MAXN];
int a[MAXN],b[MAXN];
int n,m;
class Solution {
public:
LL query(int x){
LL res=0;
for(int i=x;i>0;i-=i&-i)res+=bit[i];
return res;
}
void add(int x,int v){
for(int i=x;i<=m;i+=i&-i)bit[i]+=v;
}
int InversePairs(vector<int> data) {
n=data.size();
if(n==0)return 0;
copy(data.begin(),data.end(),a+1);
sort(a+1,a+n+1);
m=unique(a+1,a+n+1)-a-1;
for(int i=1;i<=n;++i)b[i]=lower_bound(a+1,a+m+1,data[i-1])-a;
LL ans=0;
for(int i=n;i>0;--i){
if(b[i]>1)ans=(ans+query(b[i]-1))%1000000007;
add(b[i],1);
}
return ans;
}
};