题目
在数组中的两个数字,如果前面一个数字大于后面的数字,则这两个数字组成一个逆序对。输入一个数组,求出这个数组中的逆序对的总数。例如,在数组{7,5,6,4}中,一共存在5个逆序对,分别是(7,6)、(7,5)、(7,4)、(6,4)和(5,4)。
解题思路
思路1:暴力法
顺序扫描整个数组,每扫描到一个数字,逐个比较该数字和它后面的数字的大小。如果后面的数字比它小,则这两个数字就组成一个逆序对。假设数组中含有n个数字,由于每个数字都要和O(n)个数字作比较,因此这个算法的时间复杂度是O(n^2)。
思路2:归并排序
- 先把数组分解成两个长度为2的子数组,再把这两个子数组分解成两个长度为1的子数组;
- 接下来一边合并相邻的子数组,一边统计逆序对的数目;
- 在第一对长度为1的子数组{7}、{5}中7>5,因此(7,5)组成一个逆序对。同样,在第二对长度为1的子数组{6},{4}中也有逆序对(6,4);
- 由于已经统计了这两对子数组内部的逆序对,因此需要把这两对子数组进行排序,避免在之后的统计过程中重复统计;
- 逆序对的总数 = 左边数组中的逆序对的数量 + 右边数组中逆序对的数量 + 左右结合成新的顺序数组时中出现的逆序对的数量。
- 先用两个指针分别指向两个子数组的末尾,并每次比较两个指针指向的数字;
- 如果第一个子数组的数字大于第二个子数组中的数字,则构成逆序对,并且逆序对的数目等于第二个子数组中剩余数字的个数,如图(a),(c);
- 如果第一个数组中的数字小于或等于第二个数数组中的数字,则不构成逆序对,如图(b);
- 每次比较时,我们都把较大的数字从后往前复制到一个辅助数组,确保辅助数组中的数字是递增排序的;
- 在把较大的数字复制到辅助数组后,把对应的指针向前移动一位,接下来进行下一轮比较;
- 归并排序的时间复杂度是O(nlogn),比暴力法O(n^2)要快,但同时归并排序需要一个长度为n的辅助数组,用O(n)的空间消耗换取时间效率的提升。
代码
class Solution{
public:
int InversePairs(vector<int> data){
//异常情况
if(data.size() == 0) return 0;
//排序的辅助数组
vector<int> copy;
//赋初值
for(int i = 0; i < data.size(); i++) copy.push_back(data[i]);
//1000000007是最小的十位质数。模1000000007,可以保证值永远在int的范围内。
return InversePairsCore(data, copy, 0, data.size()-1) % 1000000007;
}
//InversePairsCore的作用是对data的左右半段进行合并,复制到辅助数组copy中有序。
//因为合并之后可能超出int范围,所以用long
long InversePairsCore(vector<int> &data, vector<int> ©, int begin, int end){
//如果指向相同的位置,则没有逆序对
if(begin == end){
copy[begin] = data[end];
return 0;
}
//求中点
int mid = (begin + end) >> 1;
//InversePairsCore形参的顺序是(data,copy),而递归调用时实参是(copy,data)。
//是data左半段有序,并返回左半段逆序对的数目
long leftCount = InversePairsCore(copy, data, begin, mid);
//使data右半段有序,并返回右半段逆序对的数目
long rightCount = InversePairsCore(copy, data, mid + 1, end);
int i = mid; // i初始化为前半段最后一个数字的下标
int j = end; // j初始化为后半段最后一个数字的下标
int indexcopy = end; //辅助数组复制的数组最后一个数字的下标
long count = 0; //计数,逆序对的个数
while(i >= begin && j >= mid +1){
if(data[i] > data[j]){
//赋值到辅助数组(先赋值后减)
copy[indexcopy--] = data[i--];
//等于第二个子数组剩余的数字
count += j - mid;
}
else{
copy[indexcopy--] = data[j--];
}
}
将左右半段剩余数字赋值辅助数组
for(; i >= begin; i--) copy[indexcopy--] = data[i];
for(; j >= mid + 1; j--) copy[indexcopy--] = data[j];
return leftCount + rightCount + count;
}
};
递归调用时交换copy和data顺序的原因:
首先data=copy,两者相同,经过排序后data左半部分仍旧乱序,但copy左半部分已经存储了排好序的data左半部分。这样在向上层递归时,data左半部分本身可以作为一个容器,copy左半部分可以作为已经排好序的一个单元,两者身份互换。