H 指数
题目描述:
274. H 指数
给定一位研究者论文被引用次数的数组(被引用次数是非负整数)。编写一个方法,计算出研究者的 h 指数。
h 指数的定义:h 代表“高引用次数”(high citations),一名科研人员的 h 指数是指他(她)的 (N 篇论文中)总共有 h 篇论文分别被引用了至少 h 次。且其余的 N - h 篇论文每篇被引用次数 不超过 h 次。
例如:某人的 h 指数是 20,这表示他已发表的论文中,每篇被引用了至少 20 次的论文总共有 20 篇。
示例:
输入:citations = [3,0,6,1,5]
输出:3
解释:给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5 次。
由于研究者有 3 篇论文每篇 至少 被引用了 3 次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3。
提示:
如果 h 有多种可能的值,h 指数是其中最大的那个。
解法
非常直观的思路就是先对数组排序,然后看比索引大的元素有多少个。
代码
class Solution:
def hIndex(self, citations: List[int]) -> int:
citations.sort(reverse=True)
for idx, item in enumerate(citations):
if idx >= item:
return idx
return len(citations)
测试结果
执行用时:36 ms, 在所有 Python3 提交中击败了 88.15% 的用户
内存消耗:15.1 MB, 在所有 Python3 提交中击败了 27.52% 的用户
解法二
解法一唯一的缺点在于排序导致复杂度升高,由于 h 指数的最大值其实是数组的长度n,所以大于n的元素和等于n的元素的作用是一样的。如此就可以类似桶排序的思想,将所有元素落在0~n这 n+1 个桶内。如此便可以将复杂度将为O(n)。
代码
class Solution:
def hIndex(self, citations: List[int]) -> int:
n = len(citations)
cnt = [0 for _ in range(n + 1)]
for citation in citations:
cnt[min(n, citation)] += 1
h_index = 0
for i in range(n, -1, -1):
h_index += cnt[i]
if h_index >= i:
return i
return 0
测试结果
执行用时:36 ms, 在所有 Python3 提交中击败了 88.15% 的用户
内存消耗:15.3 MB, 在所有 Python3 提交中击败了 5.31% 的用户
说明
算法题来源:力扣(LeetCode)