题目
给你一个整数数组 citations
,其中 citations[i]
表示研究者的第 i
篇论文被引用的次数。计算并返回该研究者的 h
指数。
根据维基百科上 h 指数的定义:h
代表“高引用次数” ,一名科研人员的 h
指数 是指他(她)至少发表了 h
篇论文,并且每篇论文 至少 被引用 h
次。如果 h
有多种可能的值,h
指数 是其中最大的那个。
示例 1:
输入:citations = [3,0,6,1,5]
输出:3 解释:给定数组表示研究者总共有5篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5次。 由于研究者有 3 篇论文每篇 至少 被引用了 3 次, 其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3。
示例 2:
输入:citations = [1,3,1] 输出:1
思路
针对从集合中找元素的题目,一定需要一个额外数组进行对应状态的统计。可以使用的包括 int 数组,或 map 集合进行存储。
根据定义,我们可以发现 H 指数不可能大于总的论文发表数,所以对于引用次数超过论文发表数的情况,我们可以将其按照总的论文发表数来计算即可。
这样我们可以限制参与排序的数的大小为 [0,n](其中 n 为总的论文发表数),使得计数排序的时间复杂度降低到 O(n)。
最后我们可以从后向前遍历数组 counter ,对于每个 0 ≤ i ≤ n,在数组 counter 中得到大于或等于当前引用次数 i 的总论文数。当我们找到一个 H 指数 时跳出循环,并返回结果。
public class Solution {
public int hIndex(int[] citations) {
int n = citations.length, tot = 0;
// 索引代表沦为的引用次数,对应的值为发表的论文数
int[] counter = new int[n + 1];
for (int i = 0; i < n; i++) {
// 如果发表论文,索引数数比总论文数多,则给最大索引对应论文数 ++
if (citations[i] >= n) {
counter[n]++;
} else {
// 否则,给当前索引对应论文数 ++
counter[citations[i]]++;
}
}
// 倒序处理
for (int i = n; i >= 0; i--) {
// 如果对应论文数累加 > 索引数,则说明获得最大影响因子
tot += counter[i];
if (tot >= i) {
return i;
}
}
return 0;
}
}