Pandas数据分析初学--Apply函数

探索1960 -2014美国犯罪数据

首先导入Pandas库

import pandas as pd

(1). 将数据框命名为crime;

#因为这个表中的数据有不同,所以需要将col=0的列设为index
crime = pd.read_csv('US_Crime_Rates_1960_2014.csv',index_col=0)

(2). 每一列(column)的数据类型是什么样的?

crime.info()

(3). 将Year的数据类型转换为datetime64;

crime.Year = pd.to_datetime(crime.Year,format='%Y')

(4). 将列Year设置为数据框的索引;

crime = crime.set_index('Year',drop=True)

(5). 删除名为Total的列;

del crime['Total']
#打印一下,查看是否删除成功
crime.head()

(6). 按照Year(每十年)对数据框进行分组并求和;

crimes = crime.resample('10AS').sum()
population = crime.resample('10AS').max() #人口是累计数,不能直接求和
crimes['Population'] = population
crimes

(7). 何时是美国历史上生存最危险的年代?

crime.idxmax(0)

数据表Github链接:https://github.com/Booting-O/Pandas-Practice.git

  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值