pandas 日期处理
依赖datatime
这是日期求天数 得到的是 timedelta64类型 想要转为 int 类型 方便后面计算。
data["F"] = pd.DataFrame(pd.to_datetime(data['LOAD_TIME']) - pd.to_datetime(data['FFP_DATE']))
import numpy as np
data["F"]=(data["F"] / np.timedelta64(1, 'D')).astype(int)
后面是分析方法(和日期处理无关)
数据差异大 标准化 消除数量级数据带来的影响 方便以后聚类分析
data_z = (data - data.mean(axis = 0))/(data.std(axis = 0))