一、题目
给你一个整数数组 citations ,其中 citations[i] 表示研究者的第 i 篇论文被引用的次数。计算并返回该研究者的 h 指数。
根据维基百科上 h 指数的定义:h 代表“高引用次数” ,一名科研人员的 h 指数 是指他(她)至少发表了 h 篇论文,并且 至少 有 h 篇论文被引用次数大于等于 h 。如果 h 有多种可能的值,h 指数 是其中最大的那个。
示例 1:
输入:citations = [3,0,6,1,5]
输出:3
解释:给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5 次。
由于研究者有 3 篇论文每篇 至少 被引用了 3 次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3。
示例 2:
输入:citations = [1,3,1]
输出:1
提示:
n == citations.length
1 <= n <= 5000
0 <= citations[i] <= 1000
二、解法
排序,然后从大到小开始遍历,统计符合要求的就好了,因为后面一定不会比前面小,所以可以放心遍历
比如citations = [3,0,6,1,5]
,先对它进行排序,得到[0,1,3,5,6]
先假设h = 0
,然后从后向前遍历
遇到了6
,6
比当前h
大,则将h+1
,为什么只加1
呢?因为根据h
的定义,至少有h
篇论文被引次数大于h
。目前只遇到了一篇,所以就加1
就ok。
到后面不怕少加吗?不怕,因为最好情况下每次遇到都+1,不加也没事,说明当前被引用数不够。
下图,每一个大框内,右边一列是大于它的数的个数,左边一列是当前被引用的数量。
完整代码
class Solution:
def hIndex(self, citations: List[int]) -> int:
n = len(citations)
citations.sort()
h = 0
for i in range(n - 1, -1, -1):
if citations[i] > h:
h += 1
return h