头歌 7. Pandas高效化运算与时间序列处理

这篇博客通过三关展示了Pandas在时间序列数据处理中的应用。第一部分涉及字符串操作,提取并处理CSV文件中场馆名称的最后一个单词。第二部分介绍了日期和时间工具,包括创建日期范围和时间间隔。第三部分深入讲解了Pandas时间序列的高级用法,如按季度和月度计算平均值,数据平移以及计算滚动标准差,并绘制相关图表进行分析。
摘要由CSDN通过智能技术生成

第1关:字符串操作方法

import pandas as pd
def demo():
    #********** Begin **********#
    data = pd.read_csv("./step1/bournemouth_venues.csv")
    data1 = data["Venue Name"]
    data2= data1.str.split().str.get(-1)
    data3 = data2.str.replace("P.*","")
    data3.drop(data3[data3.values==""].index,inplace = True)
    data4 = data3.str.contains("[a-zA-Z]+")
    data3.drop(data4[data4==False].index,inplace=True)
    return data3
    # ********** End **********#

第2关:Pandas的日期与时间工具

import pandas as pd
date_number = input()
# ********** Begin ********** #
date_time = pd.date_range(date_number,periods=10,freq="D")
print(date_time)  # print(date1.to_timestamp())
date1 = pd.period_range(date_number,periods=10,freq="D")
print(date1)  # print(date_time.to_period("D"))
date_time = pd.timedelta_range("1 hours",periods=10,freq="H")
print(date_time)
# ********** End ********** #

第3关:Pandas时间序列的高级应用

import matplotlib.pyplot as plt
import pandas as pd
def demo():
    yahoo = pd.read_csv("./step3/yahoo_data.csv")
    yahoo.set_index(pd.to_datetime(yahoo["Date"]),inplace=True)
    # 取雅虎股票的收盘价
    yh = yahoo["Close"]
    fig, ax = plt.subplots(2, sharex=True)
    # 画出收盘价的图
    yh.plot(ax=ax[0], style="-")
    # 求上个季度(仅含工作日)的平均值
    # ********** Begin ********** #
    data1 = yh.resample("BQ").mean()
    # ********** End ********** #
    data1.plot(ax=ax[0], style=":")
    # 求每个月末(仅含工作日)的收盘价
    # ********** Begin ********** #
    data2 = yh.asfreq("BM")
    # ********** End ********** #
    data2.plot(ax=ax[0], style="--", color="red")
    ax[0].legend(['input', 'resample', 'asfreq'], loc='upper right')
    # 迁移数据365天
    # ********** Begin ********** #
    data3 = yh.shift(365)
    # ********** End ********** #
    data3.plot(ax=ax[1])
    data3.resample("BQ").mean().plot(ax=ax[1], style=":")
    data3.asfreq("BM").plot(ax=ax[1], style="--", color="red")
    # 设置图例与标签
    local_max = pd.to_datetime('2007-11-05')
    offset = pd.Timedelta(365, 'D')
    ax[0].axvline(local_max, alpha=0.3, color='red')
    ax[1].axvline(local_max + offset, alpha=0.3, color='red')
    # 求一年期移动标准差
    # ********** Begin ********** #
    rolling = yh.rolling(365)
    data4 = rolling.std()   
    # ********** End ********** #
    data4.plot(ax=ax[1], style="y:")
    data4.plot(ax=ax[0], style="y:")
    plt.savefig("./step3/result/2.png")

  • 2
    点赞
  • 13
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值