从excel读取日期时因为是datetime类型,所以会是“年月日时分秒”格式;存入excel文档时因为是datetime类型,excel又自动加上了时分秒。
查看了几篇文章,大部分采用的方法是用apply将日期类型转换为字符型,再切片将时分秒切掉。这个方法不够优雅,而且转为字符型,不利于后期对日期进行排序或计算。
废话不多说了,上代码。
df['日期'] = df['日期'].dt.date
df.to_excel('test.xlsx')
注:以上方法当遇到同时存在xxxx/xx/xx和****.**.** 等日期格式时,报错。
Can only use .dt accessor with datetimelike values
解决办法:
将日期列先统一转换下,再去掉时分秒
# 22.10.19改进
df['日期'] = pd.to_datetime(df['日期']).dt.date
df.to_excel('test.xlsx')
将字符型日期转为日期类型
方法一:
df['date'] = df['date'].astype('datetime64')
方法二:
df['date'] = pd.to_datetime(df['date'])