Table of Contents
import pandas as pd
import numpy as np
from sklearn.preprocessing import OneHotEncoder
时间(戳)的格式化
data=pd.read_csv(r"D:\downloads\tempo使用1.csv",encoding='gbk')
data.head()
SYS_NAME
CWXT_DB184C
COLLECTTIME
0
财务管理系统
34270787.33
2014-10-01
1
财务管理系统
34328899.02
2014-10-02
2
财务管理系统
34327553.50
2014-10-03
3
财务管理系统
34288672.21
2014-10-04
4
财务管理系统
34190978.41
2014-10-05
pd.to_datetime(data['COLLECTTIME'])[0]
Timestamp('2014-10-01 00:00:00')
data['date']=pd.to_datetime(data['COLLECTTIME'],format="%Y-%m-%d")#数据格式化输出
data.head()
SYS_NAME
CWXT_DB184C
COLLECTTIME
date
0
财务管理系统
34270787.33
2014-10-01
2014-10-01
1
财务管理系统
34328899.02
2014-10-02
2014-10-02
2
财务管理系统
34327553.50
2014-10-03
2014-10-03
3
财务管理系统
34288672.21
2014-10-04
2014-10-04
4
财务管理系统
34190978.41
2014-10-05
2014-10-05
提取时间特征:年、月、日、季度等
data['quarter']=data['date'].dt.quarter#提取季度
data.head()
SYS_NAME
CWXT_DB184C
COLLECTTIME
date
quarter
0
财务管理系统
34270787.33
2014-10-01
2014-10-01
4
1
财务管理系统
34328899.02
2014-10-02
2014-10-02
4
2
财务管理系统
34327553.50
2014-10-03
2014-10-03
4
3
财务管理系统
34288672.21
2014-10-04
2014-10-04
4
4
财务管理系统
34190978.41
2014-10-05
2014-10-05
4
data['month'],data['day']=data['date'].dt.month,data['date'].dt.day#提取月、天
data.head()
SYS_NAME
CWXT_DB184C
COLLECTTIME
date
quarter
month
day
0
财务管理系统
34270787.33
2014-10-01
2014-10-01
4
10
1
1
财务管理系统
34328899.02
2014-10-02
2014-10-02
4