题目:H 指数
给你一个整数数组 citations
,其中 citations[i]
表示研究者的第 i
篇论文被引用的次数。计算并返回该研究者的 h
指数。
根据维基百科上 h 指数的定义:h
代表“高引用次数” ,一名科研人员的 h
指数 是指他(她)至少发表了 h
篇论文,并且 至少 有 h
篇论文被引用次数大于等于 h
。如果 h
有多种可能的值,h
指数 是其中最大的那个。
示例 1:
输入:
citations = [3,0,6,1,5]
输出: 3
解释: 给定数组表示研究者总共有5
篇论文,每篇论文相应的被引用了3, 0, 6, 1, 5
次。
由于研究者有3
篇论文每篇 至少 被引用了3
次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是3
。
示例 2:
输入: citations = [1,3,1]
输出: 1
解题方法
1. 排序
思路
这个算法的核心思路是从最有希望成为 h 指数的论文开始,逐步增加 h 值,直到找不到更多符合条件的论文。最终的 h 值就是研究者的 h 指数。
步骤
- 首先进行排序,把引用次数按从小到大排序,这样可以更方便地找到满足 h 指数的值。
- 进行倒序遍历。从最大引用次数开始,逐个检查每篇论文是否符合 h 指数的条件(即引用次数要大于当前的 h 值)。
- 只要当前论文的引用次数大于当前的 h 值,就把 h 值加 1。
- 遍历结束时,h 值就是研究者的 h 指数。
时间复杂度:O(nlogn)
空间复杂度:O(1*排序算法空间复杂度)
代码
func hIndex(citations []int) int {
n := len(citations)
h := 0
sort.Ints(citations)
for i := n-1; i >= 0 ; i-- {
if citations[i] > h {
h++
}
}
return h
}
2. 计数排序
思路
第一种方法是按被引次数排序后直接查找 h
值,它是从 引用次数 出发。这种算法的缺点是时间复杂度依赖排序算法,从而导致了多余的时间开销。
而 计数排序法 从 论文数量 出发,通过利用一个长度为n的数组来统计每个引用次数对应的论文数量,然后,从高引用次数开始往下逐步累积符合条件的论文数,通过这个累积值来判断最大的 h
指数。
时间复杂度:O(n)
空间复杂度:O(n)
代码
func hIndex(citations []int) int {
n := len(citations)
counter := make([]int, n+1)
// 填充计数数组
for _, citation := range citations {
if citation >= n {
counter[n]++
} else {
counter[citation]++
}
}
// 从后往前累加,找到满足条件的最大 h 值
h := 0
for i := n; i >= 0; i-- {
h += counter[i]
if h >= i {
return i
}
}
return 0
}