题目
思路
第一步求矩阵所有坐标(a,b)
的值,根据异或运算的性质,有
(a,b) = (a - 1, b) ^ (a, b - 1) ^ (a - 1, b - 1) ^ matrix[a][b]
(a,b)表示第a行,第b列
如图所示,(a,b)
坐标对应了绿色(左上角3x3)的矩阵中所有元素的异或结果,(a-1,b)
对应了蓝色(左上角2x3)的矩阵中所有元素异或的结果,(a,b-1)
对应了黄色(左上角3x2)的矩阵中所有元素异或的结果,(a-1, b-1)
对应了前述三个矩阵的重叠区域的矩阵中所有元素的异或结果,根据异或运算a ^ a = 0
的特点,即可得到上述结论,即
(a,b) = (a - 1, b) ^ (a, b - 1) ^ (a - 1, b - 1) ^ matrix[a][b]
对于a < 1
或者b < 1
导致某个矩阵不存在的情况(例如a-1 < 0
使得蓝色矩阵以及重叠区域矩阵不存在),则在计算(a,b)
时不异或对应矩阵坐标值即可。
计算出的所有(a,b)
无需存放在矩阵中,直接存放在一维数组arr
中即可。
第二步我们需要求出数组arr
中第k
大的数(不是第k
小),注意第k
大是降序排列时排第k
位的数。我们可以通过快速排序的算法来搜索降序排列时排第k
的数。因为快速排序每执行一轮交换就会将一个数pivot
放到正确的排序位置i
上,根据i
的大小我们可以决定下一轮交换的执行范围。即如果i == k - 1
, 表示arr[i]
就是第k
大的数,可以直接返回;如果i < k - 1
则需要在数组中第i
位之后的部分进行搜索(i
之前的部分可以不考虑);如果i > k - 1
则需要在数组中第i
位之前的部分进行搜索(i
之后的部分可以不考虑),当搜索区间减小到1
时这个数就是第k
大的数,可以直接返回。
k
从1开始计算,而数组索引从0
开始,因此i = k - 1
表示第k
大的数对应数组中的索引位置
代码
class Solution {
public:
int kthLargestValue(vector<vector<int>>& matrix, int k) {
int m = matrix.size();
int n = matrix[0].size();
int* arr = new int[ m * n ];
for(int i=0; i<m; i++) {
for (int j=0; j<n; j++) {
arr[i * n + j] = matrix[i][j];
if (i > 0) {
arr[i * n + j] ^= arr[ (i - 1) * n + j ];
}
if (j > 0) {
arr[i * n + j] ^= arr[ i * n + j - 1 ];
}
if (i > 0 && j > 0) {
arr[i * n + j] ^= arr[ (i - 1) * n + j - 1];
}
}
}
int size = m * n;
int start = 0, end = size - 1;
while(start < end) {
int pivot = arr[start];
int i = start, j = end;
while (i < j) {
// 设置为<=pivot(即等于pivot时不交换)会超时
while (arr[j] < pivot && i < j) {
j--;
}
if (i >= j) {
break;
}
arr[i] = arr[j];
i++;
// 设置为>=pivot(即等于pivot时不交换)会超时
while (arr[i] > pivot && i < j) {
i++;
}
if (i >= j) {
break;
}
arr[j] = arr[i];
j--;
}
arr[i] = pivot;
// 找到答案
if (i == k - 1) {
return arr[i];
} else if (i > k - 1) {
end = i - 1;
} else if ( i < k - 1) {
start = i + 1;
}
}
return arr[start];
}
};
一些问题
在写快排的交换算法过程中,一开始我选择在数组中元素等于pivot
(用于分界的元素)时不执行交换操作,然而这导致在运行较大的测试用例时超时。下图时每轮交换后中间位置i
的值,可以看到存在许多每轮交换仅使得搜索区间减小一位的情况,这导致时间复杂度接近O(n^2
)而不是O(nlogn)
(可以看到执行了19800多轮交换还没有找到结果),因此会导致超时。
后来我将算法改为在数组中元素等于pivot
(用于分界的元素)时执行交换操作,则成功通过,可以看到,仅执行了24轮交换即得到了最终结果。其中的原因我还不是特别清楚,可能是选择在等于pivot
时也执行交换使得头部和尾部的指针向中间移动的机会更多,减少了两个指针移动次数不平衡导致划分的区间不平衡使得算法时间复杂度退化到O(n^2)
的概率,从而执行得更快。