数据科学库--pandas中的时间序列

本文探讨了如何在pandas中处理时间序列数据。介绍了两种创建全0 DataFrame的方法,并展示了设置时间序列及时间间隔的方式。还讨论了pandas的重采样功能,用于分析911电话数据中不同月份各类电话的数量变化。
摘要由CSDN通过智能技术生成

数据科学库--第六天

应用

统计911报警电话原因的分类
第一种方式:构建全为0的Dataframe

import pandas as pd
import numpy as np
from matplotlib import pyplot as plt

file_path = "./911.csv"
df = pd.read_csv(file_path)
#获取分类

temp_list = df["title"].str.split(":").tolist()
cate_list = list(set([i[0] for i in temp_list]))
print(cate_list)


#g构造全为0的数据

zeros_df = pd.DataFrame(np.zeros((df.shape[0],len(cate_list))),columns=cate_list)

#给全0数组赋值,对zeros_df的三列进行遍历处理,相较于对整个temp_list的25万行进行遍历要快的多
for cate in cate_list:
    zeros_df[cate][df["title"].str.contains(cate)] = 1
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值