时间序列
说明
业务背景:
实际业务中对于时间序列数据处理一直是数据预处理中的一个小难点,本章节主要记录工作中常使用的时间序列产生、转化、切片等知识点
数据来源/知识来源:
1. pandas官方文档:https://pandas.pydata.org/pandas-docs/stable/user_guide/timeseries.html#time-series-related-instance-methods
2. 业务处理数据(以”上证指数收盘价历史数据“为例)
版权声明:如有侵权,请联删除,感谢!
基础
Time-Series:以时间为索引的Series
时间序列分析
- 时间序列(time series)是经济学的一种统计方法,它是采用时间排序的一组随机变量,国内生产总值GDP 消费者物价指数CPI 股价指数 利率 汇率等都是时间序列。时间序列的时间间隔可以是分秒,可以是日 周 月 季度 年 甚至更大的时间单位
- Pandas经常被用于处理与时间序列相关的数据,一般会遇到以下需求:
·生成固定跨度的时期构成时间序列 —【时间戳的生成】
·将现有的时间序列,转换成需要的时间序列格式 —【日期数据的转化】
·计算序列中的相对时间,例如 每季度的第一周 —【切片索引/间隔计算】
1. 时间戳的生成
导入库
import pandas as pd
import numpy as np
import time
import datetime
import matplotlib.pyplot as plt
plt.rcParams['axes.unicode_minus'] = False
plt.rcParams['font.sans-serif'] = ['Simhei']
time.time() #秒 当前时间 1970年到现在金国的秒数
pd.Timestamp(time.time(),unit='s')#转换为标准时间 时间戳的形式
1.1 pd.Timestamp
#时间戳
pd.Timestamp(1653211271.9308,unit='s')
pd.Timestamp(year=2022, month=12, day=12, hour=0,minute=0,second=0)
不同输入格式结果
pd.Timestamp("2022-12-12")
pd.Timestamp("2022/12/12")
pd.Timestamp(2022,12,12)
Time/date