题目
给你一个整数数组 citations
,其中 citations[i]
表示研究者的第 i
篇论文被引用的次数。计算并返回该研究者的 h
指数。
根据维基百科上 h 指数的定义:h
代表“高引用次数” ,一名科研人员的 h
指数 是指他(她)至少发表了 h
篇论文,并且 至少 有 h
篇论文被引用次数大于等于 h
。如果 h
有多种可能的值,h
指数 是其中最大的那个。
示例 1:
输入:citations = [3,0,6,1,5]
输出:3
解释:给定数组表示研究者总共有 5 篇论文,每篇论文相应的被引用了 3, 0, 6, 1, 5 次。
由于研究者有 3 篇论文每篇 至少 被引用了 3 次,其余两篇论文每篇被引用 不多于 3 次,所以她的 h 指数是 3。
示例 2:
输入:citations = [1,3,1]
输出:1
提示:
n == citations.length
1 <= n <= 5000
0 <= citations[i] <= 1000
思路
翻译一下题目,就是给定一个整数数组citation,要求得到h。这个h同时满足>citation.size()
以及>=h
的元素数大于等于h。
第一反应的思路是对数组做降序排序,找到满足a[a[i]-1]>=a[i]的最小i,即得h=a[i]。
这个思路需要考虑几个限制条件。
0<a[i]<=a.size()
- 如果没有这种i,例如对于
[4,4,1,1]
的情况。这种情况应该是要取a[i]>i
的部分,否则直接取h=i就好了。 - 数组所有元素都不满足
a[i]<=i
或者a[a[i]-1]>=a[i]
。例如[100,100]
的情况,那么应该输出h=a.size()
。
代码:
class Solution {
public:
int hIndex(vector<int>& citations) {
sort(citations.begin(),citations.end());
reverse(citations.begin(),citations.end());
for(int i=0;i<citations.size();i++)
{
if(citations[i]<=i)
{
return i;
}else if(citations[i]<=citations.size()&&citations[i]>0&&citations[citations[i]-1]>=citations[i])
{
return citations[i];
}
}
return citations.size();
}
};
改进
迭代到下标i时,h的最大值只可能是i+1,因此只要判断a[i]是否比i+1大即可。另外,这一算法即使正序排序,所需的变动也不大,因此可以去掉reverse的步骤。得到下面的代码:
class Solution {
public:
int hIndex(vector<int>& citations) {
sort(citations.begin(),citations.end());
for(int h=0, i=citations.size()-1;i>=0;i--,h++)
{
if(citations[i]<h+1)
{
return h;
}
}
return citations.size();
}
};
这一算法的时间复杂度为O(nlogn),空间复杂度为O(logn)即排序的时空复杂度。
方法三:计数排序
因为h属于[0,n],实际上可以用n+1维数组来存储每个大小的元素数量,存储完毕后再进行一次遍历。
这一算法的时间复杂度为O(n),空间复杂度也为O(n)。
代码:
class Solution {
public:
int hIndex(vector<int>& citations) {
int n=citations.size();
vector<int>counter(n+1);
for(int i=0;i<n;i++)
{
if(citations[i]>=n)
{
counter[n]++;
}
else
{
counter[citations[i]]++;
}
}
for(int i=n, tot=0;i>=0;i--)
{
tot+=counter[i];
if(tot>=i)
{
return i;
}
}
return 0;
}
};