题目描述
给定一位研究者论文被引用次数的数组(被引用次数是非负整数),数组已经按照升序排列。编写一个方法,计算出研究者的 h 指数。
h 指数的定义: “h 代表“高引用次数”(high citations),一名科研人员的 h 指数是指他(她)的 (N 篇论文中)至多有 h 篇论文分别被引用了至少 h 次。(其余的 N - h 篇论文每篇被引用次数不多于 h 次。)"
示例:
输入: citations = [0,1,3,5,6]
输出: 3
解释: 给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 0, 1, 3, 5, 6 次。
由于研究者有 3 篇论文每篇至少被引用了 3 次,其余两篇论文每篇被引用不多于 3 次,所以她的 h 指数是 3。
说明:
如果 h 有多有种可能的值 ,h 指数是其中最大的那个。
进阶:
- 这是 H指数 的延伸题目,本题中的 citations 数组是保证有序的。
- 你可以优化你的算法到对数时间复杂度吗?
思路分析
题干里重点标注了升序排列,加上进阶里面说的对数时间复杂度,所以用二分。
套用模板,这里基础模板或者左区间模板都可。
- h指数是至多有 h 篇论文分别被引用了至少 h 次,我们可以转换为 求数组中至少能找到 h 个 大于等于 h 的数字。
- 每次二分的判断,是将 nums[mid] 和 nums.length - mid 比较(nums.length - mid 可以理解为有 nums.length - mid 篇论文)。
- 若 nums[mid] 大,表示当前 h指数为 nums.length - mid ,继续去左边判断还有没有更大的h值。
- 若小于,表示不符合,去右边继续找h值。
代码实现
public int hIndex(int[] citations) {
int n = citations.length;
if (citations == null || n == 0) {
return 0;
}
int left = 0, right = n - 1;
while (left < right) {
int mid = left + (right - left) / 2;
if (citations[mid] < n - mid) {
left = mid + 1;
} else {
right = mid;
}
}
return n - left;
}