Python 回忆录
2020/11/14
重组时间序列
运用PeriodIndex(year=df["columns"],month=df["columns"],day=df["columns"],hour=df["columns"],freq="H")
可以把不同列里面的数据组合为一个时间序列,并且按照freq 的设定来分行。
问题(处理空气质量数据)
现有一个北京的空气质量数据,绘制出PM2.5随时间的变化情况
可以看出来 数据中的时间被分为几列,这时候就需要用重组时间序列的方法
对于这道题的整体思路:
- 重组时间序列
- 时间序列变为索引
- 降采样(因为数据太多,显示不出来)
- 处理空白数据
- 画图(1时间序列转化为可读时间 2注意rotation)
# coding=utf-8
import pandas as pd
from matplotlib import pyplot as plt
file_path = "./PM2.5/BeijingPM20100101_20151231.csv"
df = pd.read_csv(file_path)
#把分开的时间字符串通过periodIndex的方法转化为pandas的时间类型
period = pd.PeriodIndex(year=df["year"],month=df[