Python中Series的切片和索引雷区

最新推荐文章于 2024-07-08 19:59:20 发布

lancelot2011

最新推荐文章于 2024-07-08 19:59:20 发布

阅读量1.2k

点赞数

分类专栏： Python数据分析文章标签： python pandas 数据分析

本文链接：https://blog.csdn.net/lancelot2011/article/details/113941784

版权

本文探讨了在Python的pandas库中，使用Series进行切片操作时遇到KeyError: 50的问题。问题源于尝试对一个以浮点型年份为索引的Series使用[:50]切片。解决方案包括使用iloc[:50]或head(50)。分析发现，浮点型索引在切片时可能导致意外行为，这可能是由于数据类型匹配问题。建议在处理类似情况时使用iloc来避免此类错误。

摘要由CSDN通过智能技术生成

Python中Series的切片和索引雷区

问题

在学习pandas的过程中，做了这样一个练习：
数据集——全球排名靠前的10000本书的数据
统计要求——统计不同年份书的数量
输出结果——通过条形图展示数据
在提取有效数据的过程中，出现了代码报错 KeyError: 50

提取有效数据的代码如下

data1 = df[pd.notnull(df['original_publication_year'])]
# 对数据按年份字段进行分组，并计数，正序排序，取前30
grouped = data1.groupby(by='original_publication_year')['id'].count().sort_values(ascending=False)[:50]
print(grouped)