1. 日期格式数据处理
• Pandas中使用to_datetime()方法将文本格式转换为日期格式
• dataframe数据类型如果为datetime64,可以使用dt方法取出年月日等
• 对于时间差数据,可以使用timedelta函数将其转换为指定时间单位的数值
• 时间差数据,可以使用dt方法访问其常用属性
import numpy as np
import pandas as pd
import os
os.chdir(r'F:\CSDN\课程内容\代码和数据')
df = pd.read_csv('baby_trade_history.csv', encoding='utf-8',dtype={'user_id':str})
df.head(10)
# 对购买日期进行转换
df['buy_date'] = pd.to_datetime(df['day'],format='%Y%m%d',errors = 'coerce')#加errors防止报错
df.dtypes
# 可以提取对应年月日,必须为timestamp才可以,具体的时间点
df['buy_date'].dt.year
时间差
# 对时间进行计算
df['diff_day'] = pd.datetime.now() - df2['birthday']
df['diff_day'].head(5)
# 时间差由天数,小时和毫秒构成
# timedelta可以理解为时间差类型
df['diff_day'].dt.days# 提取天数
df['diff_day'].dt.seconds# 提取秒数
df['diff_day'].dt.microseconds# 提取毫秒数
# 可以使用p