leetcode(29)_274_medium_H指数_python

最新推荐文章于 2021-11-21 10:28:49 发布

m_a_rookie

最新推荐文章于 2021-11-21 10:28:49 发布

阅读量175

点赞数 1

分类专栏： python_leetcode 文章标签： leetcode python 数组

本文链接：https://blog.csdn.net/qq_40137656/article/details/118660730

版权

python_leetcode 专栏收录该内容

109 篇文章 0 订阅

订阅专栏

这篇博客讨论了如何计算研究者的h指数，这是一种衡量科学家影响力的指标。提供了两种解决方案，一种是通过排序实现，另一种是利用桶排序思想降低时间复杂度到O(n)。这两种方法都在Python中实现，并在LeetCode上进行了测试，均能在大部分情况下达到较高的效率。

摘要由CSDN通过智能技术生成

H 指数

题目描述：
274. H 指数
给定一位研究者论文被引用次数的数组（被引用次数是非负整数）。编写一个方法，计算出研究者的 h 指数。
h 指数的定义：h 代表“高引用次数”（high citations），一名科研人员的 h 指数是指他（她）的（N 篇论文中）总共有 h 篇论文分别被引用了至少 h 次。且其余的 N - h 篇论文每篇被引用次数不超过 h 次。
例如：某人的 h 指数是 20，这表示他已发表的论文中，每篇被引用了至少 20 次的论文总共有 20 篇。
示例：
输入：citations = [3,0,6,1,5]
输出：3
解释：给定数组表示研究者总共有 5 篇论文，每篇论文相应的被引用了 3, 0, 6, 1, 5 次。
由于研究者有 3 篇论文每篇至少被引用了 3 次，其余两篇论文每篇被引用不多于 3 次，所以她的 h 指数是 3。
提示：
如果 h 有多种可能的值，h 指数是其中最大的那个。

解法

非常直观的思路就是先对数组排序，然后看比索引大的元素有多少个。

代码

class Solution:
    def hIndex(self, citations: List[int]) -> int:
        citations.sort(reverse=True)
        for idx, item in enumerate(citations):
            if idx >= item:
                return idx
        return len(citations)

测试结果

执行用时：36 ms, 在所有 Python3 提交中击败了 88.15% 的用户
内存消耗：15.1 MB, 在所有 Python3 提交中击败了 27.52% 的用户

解法二

解法一唯一的缺点在于排序导致复杂度升高，由于 h 指数的最大值其实是数组的长度n，所以大于n的元素和等于n的元素的作用是一样的。如此就可以类似桶排序的思想，将所有元素落在0~n这 n+1 个桶内。如此便可以将复杂度将为O(n)。

代码

class Solution:
    def hIndex(self, citations: List[int]) -> int:
        n = len(citations)
        cnt = [0 for _ in range(n + 1)]
        for citation in citations:
            cnt[min(n, citation)] += 1
        h_index = 0
        for i in range(n, -1, -1):
            h_index += cnt[i]
            if h_index >= i:
                return i
        return 0