题目地址(440. 字典序的第K小数字)
https://leetcode-cn.com/problems/k-th-smallest-in-lexicographical-order/
题目描述
给定整数 n 和 k,返回 [1, n] 中字典序第 k 小的数字。
示例 1:
输入: n = 13, k = 2
输出: 10
解释: 字典序的排列是 [1, 10, 11, 12, 13, 2, 3, 4, 5, 6, 7, 8, 9],所以第二小的数字是 10。
示例 2:
输入: n = 1, k = 1
输出: 1
提示:
1 <= k <= n <= 109
前置知识
字典序
先序遍历
思路
直观想法:将1 - n的数字转换为字符串,排序找到第k小的数字,但数据范围过大,时间复杂度过高。
利用字典树的特性将所有小于等于 n 的数字按照字典序的方式进行重建,可以得到如下:
前序遍历该字典树即可得到字典序从小到大的数字序列,遍历到第 k 个节点即为第 k 小的数字,因此构建该字典树后先序遍历,便可得到结果,时间复杂度为
O
(
k
)
O(k)
O(k), 时间复杂度仍然过高。原因就是先序遍历是一个一个都走到,因此可以在遍历时加一些优化,使得遍历的节点少一些。
优化的思路就是不必一个一个向下访问到每个叶节点,而是尽量在父节点就做出判断。
在字典树的先序遍历中,发现当访问到
c
u
r
cur
cur节点时,可以判断第
k
k
k个数是否在当前以
c
u
r
cur
cur节点为根的子树中。如果第k个数在子树中,在向下遍历,否则向右遍历,去查找第
k
−
以
c
u
r
节
点
为
子
树
的
大
小
k - 以cur节点为子树的大小
k−以cur节点为子树的大小的数,这样可以跳过以
c
u
r
cur
cur节点为根的子树不用访问。
那么如何判断第
k
k
k个数是否在以
c
u
r
cur
cur节点为根的子树?
这里按照层序遍历的思想,当前的前缀为
c
u
r
cur
cur, 下一种前缀为
c
u
r
+
1
cur + 1
cur+1,记为
n
e
x
t
next
next;
两个节点分别向下扩展,由于是十叉树,所以下一节点
c
u
r
′
=
c
u
r
∗
10
cur' = cur * 10
cur′=cur∗10,
n
e
x
t
′
=
n
e
x
t
∗
10
next' = next * 10
next′=next∗10
n
e
x
t
′
−
c
u
r
′
next' - cur'
next′−cur′就能够得到
c
u
r
′
cur'
cur′这一层的所有节点;在保证小于等于
n
n
n的前提不断向下遍历,统计出每层的节点数。在最后一层的时候,为了保证小于等于
n
n
n,该层的有效范围的右端点为
n
n
n; 所以每层的最右侧节点应该为
m
i
n
(
n
e
x
t
−
1
,
n
)
min(next - 1, n)
min(next−1,n)
统计出所有小于等于n的以
c
u
r
cur
cur为根的子树的节点个数和
s
u
m
(
c
u
r
)
sum(cur)
sum(cur),和
k
k
k作比较
- 如果满足 s u m ( c u r ) > = k sum(cur) >= k sum(cur)>=k, 说明,则此时可以肯定第 k小的节点一定在 c u r cur cur为根构成的子树中,则此时需要在cur的孩子节点中依次进行查找。减去cur根节点,向下遍历。
- 如果满足 s u m ( c u r ) < k sum(cur) < k sum(cur)<k, 说明,则此时可以肯定第 k小的节点一定不在 c u r cur cur为根构成的子树中,则从下一种前缀next开始,查找第 k − s u m ( c u r ) 个 节 点 k - sum(cur) 个节点 k−sum(cur)个节点
代码
- 语言支持:C++
C++ Code:
class Solution {
public:
int nodeCount(long long cur, int n) // 统计以cur为根的在合法范围的子树的大小
{
long long next = cur + 1;
int res = 0;
while(cur <= n) // 统计每层的节点
{
res += min(next - cur, n - cur + 1); // 每层节点的右边界为min(n, next)
cur *= 10;
next *= 10;
}
return res; // cur为根的子树的节点数目总和
}
int findKthNumber(int n, int k) {
int cur = 1;
while(k > 1)
{
if(nodeCount(cur, n) >= k) // cur为根的子树的节点数目总和 >= k
{
k --; // 去掉cur节点
cur *= 10; // 向下搜寻
}
else
{
k -= nodeCount(cur, n); // 去掉cur为根的子树的节点数目总和
cur ++; // 遍历下一种前缀
}
}
return cur;
}
};
复杂度分析
令 n 为数组长度。
- 时间复杂度: O ( l o g ( N ) ) O(log(N)) O(log(N))
- 空间复杂度: O ( 1 ) O(1) O(1)