一、现在我们有2015到2017年25万条911的紧急电话的数据,请统计出这些数据中不同类型的紧急情况的次数,如果我们还想统计出不同月份不同类型紧急电话的次数的变化情况。应该怎么做?
import numpy as np
import pandas as pd
from matplotlib import pyplot as plt
df=pd.read_csv("./911.csv")
print(df.head())
print(df.info())
temp_list=df[“title”].str.split("😊.tolist()
cate_list=list(set(i[0] for i in temp_list))
print(cate_list)
#构造全为0的数组
zeros_df=pd.DataFrame(np.zeroes((df.shape[0],len(cate_list))),columns=cate_list)
#赋值
for cate in cate_list
print(df[“title”].str.contains(cate))
break
为什么要学习Pandas中的时间序列
不管在什么行业,时间序列都是一种非常重要的数据形式。很多统计数据以及数据的规律也都和时间序列有着非常重要的联系。而且在pandas中处理时间序列是非常简单的。
生成一段时间范围
pd.data range(start=None,end=None,periods=None,freq=‘D’)
start和end以及freq配合能够生成start和end范围以频率freg的一组时间索引
start和periods以及freq配套能够生成从start开始的频率为freg的periods个时间所以
eg:import p