题目数据来源:https://www.kesci.com/mw/notebook/5c1b599d8859e0002b718378
目录
1. 导入库
import pandas as pd
2. 加载数据
crime = pd.read_csv('US_Crime_Rates_1960_2014.csv')
3. 每一列(columns)的数据类型是什么样的
crime.info()
4. 将Year的数据类型转换为datetime64
crime['Year'] = pd.to_datetime(crime.Year, format='%Y')
5. 将列Year设置为数据框的索引
crime = crime.set_index('Year')
crime.head()
6. 删除名为Total的列
crime.drop('Total', axis=1, inplace=True)
# 或:
# del crime['Total']
pandas删除列的方法具体可查看这篇博客:https://blog.csdn.net/u010159842/article/details/52859035
https://blog.csdn.net/songyunli1111/article/details/79306639
7. 按照Year对数据框进行分组求和
crime.groupby('Year').sum()
8. 何时是美国历史上最危险的年代
crime.idxmax()
另:idxmax()官方文档解释:
详情链接:https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.idxmax.html?highlight=idxmax