python时间序列特征提取_python:时间序列的处理

本文介绍了如何使用Python对时间序列数据进行处理,包括时间戳的格式化,提取年、月、日、季度、小时等特征,以及时间差的计算和转换。通过示例展示了如何利用pandas库进行时间操作,如`pd.to_datetime`用于时间格式化,`dt`属性用于提取日期和时间信息,并创建新的时间特征。同时,还展示了如何计算跨天时间差的正确方式以及使用`Timedelta`和`DateOffset`进行时间的前进与后退操作。
摘要由CSDN通过智能技术生成

Table of Contents

import pandas as pd

import numpy as np

from sklearn.preprocessing import OneHotEncoder

时间(戳)的格式化

data=pd.read_csv(r"D:\downloads\tempo使用1.csv",encoding='gbk')

data.head()

SYS_NAME

CWXT_DB184C

COLLECTTIME

0

财务管理系统

34270787.33

2014-10-01

1

财务管理系统

34328899.02

2014-10-02

2

财务管理系统

34327553.50

2014-10-03

3

财务管理系统

34288672.21

2014-10-04

4

财务管理系统

34190978.41

2014-10-05

pd.to_datetime(data['COLLECTTIME'])[0]

Timestamp('2014-10-01 00:00:00')

data['date']=pd.to_datetime(data['COLLECTTIME'],format="%Y-%m-%d")#数据格式化输出

data.head()

SYS_NAME

CWXT_DB184C

COLLECTTIME

date

0

财务管理系统

34270787.33

2014-10-01

2014-10-01

1

财务管理系统

34328899.02

2014-10-02

2014-10-02

2

财务管理系统

34327553.50

2014-10-03

2014-10-03

3

财务管理系统

34288672.21

2014-10-04

2014-10-04

4

财务管理系统

34190978.41

2014-10-05

2014-10-05

提取时间特征:年、月、日、季度等

data['quarter']=data['date'].dt.quarter#提取季度

data.head()

SYS_NAME

CWXT_DB184C

COLLECTTIME

date

quarter

0

财务管理系统

34270787.33

2014-10-01

2014-10-01

4

1

财务管理系统

34328899.02

2014-10-02

2014-10-02

4

2

财务管理系统

34327553.50

2014-10-03

2014-10-03

4

3

财务管理系统

34288672.21

2014-10-04

2014-10-04

4

4

财务管理系统

34190978.41

2014-10-05

2014-10-05

4

data['month'],data['day']=data['date'].dt.month,data['date'].dt.day#提取月、天

data.head()

SYS_NAME

CWXT_DB184C

COLLECTTIME

date

quarter

month

day

0

财务管理系统

34270787.33

2014-10-01

2014-10-01

4

10

1

1

财务管理系统

34328899.02

2014-10-02

2014-10-02

4

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值