调包,导入数据
import numpy as np
import pandas as pd
#读取数据
df = pd.read_csv('xx.csv')
1、将str时间戳转化为datetime64 (pandas中的日期型数据)
df['date'] = df['date'].astype('datetime64') #datetime64[ns]
df['date'] = df['date'].astype('datetime64[D]')
datetime64[ns]:转化后形式如 2020-09-20 18:13:00
datetime64[D] :转化后形式如 2020-09-20
只输入datetime64,则默认为datetime64[ns]。
2、从数据中提取基本信息
df['年'] = df['date'].dt.year
df['季度'] = df['date'].dt.quarter
df['月'] = df['date'].dt.month
df['日'] = df['date'].dt.day
df['星期几'] = df['date'].dt.dayofweek
df['周'] = df['date'].dt.week #一年中的第几周
df['时'] = df['date'].dt.hour
df['分'] = df['date'].dt.minute
df['秒'] = df['date'].dt.second
df['天'] = df['date'].dt.dayofyear #一年中的第几天
3、提取模糊信息
df['是否闰年'] = df['date'].apply(lambda x: x.is_leap_year) # 是否闰年
df['是否月初'] = df['date'].apply(lambda x: x.is_month_start) # 是否月初
df['是否月末'] = df['date'].apply(lambda x: x.is_month_end) # 月末
df['是否季节初'] = df['date'].apply(lambda x: x.is_quarter_start) # 季度初
df['是否季节末'] = df['date'].apply(lambda x: x.is_quarter_end) # 季度末
df['是否年初'] = df['date'].apply(lambda x: x.is_year_start) # 年初
df['是否年尾'] = df['date'].apply(lambda x: x.is_year_end) # 年内末
4、提取节日信息(待补充)