最近在学习python将数据导入到excel,发现日期变成数字而不是日期格式的问题。
第一眼看去肯定是excel单元格格式问题,一般excel单元格格式为常规,而常规处理日期时就显示为数字,所以就想到用一个特定的数字(知道具体日期的),增加一天对应的数字就加1。
先看看python直接导入后日期的样子(下面时我随机举例的):
我们需要日期数据替换成标准的日期格式,具体的思路是:
1、先用excel实验2019-5-02对应的日期时间戳是43587。
2、再用2019-5-02减43587看是从什么时候开始计算,结论是1899-12-30。
import pandas as pd
pd.to_datetime('2019-05-02')-pd.Timedelta('43587D') #D表示天 #Timestamp('1899-12-30 00:00:00')
3、那么最后时间戳转化为日期:就只需要当前时间戳+1899-12-30
批量转化(定义转化日期戳的函数,dates为日期戳)
方法一:用pd中得Timedelta和to_datetime
import pandas as pd def date(stamp): #这个有个弊端,输入得时间戳过大后报错,最大支持多少106751 delta = pd.Timedelta(str(stamp)+'D') real_time = pd.to_datetime('1899-12-30') + delta return real_time
方法二:用datetime模块得timedelta、datetime.strptime
import datetime def date(dates): delta=datetime.timedelta(days=dates) today=datetime.datetime.strptime('1899-12-30','%Y-%m-%d')+delta #将1899-12-30转化为可以计算的时间格式并加上要转化的日期戳 return datetime.datetime.strftime(today,'%Y-%m-%d')#制定输出日期的格式
以下代码是将excel时间戳转化成标准日期,并替换原有列名的具体步骤:
import openpyxl import datetime data = openpyxl.load_workbook(r'E:\work_hot\temp\docx\time_test.xlsx') def date(dates): delta=datetime.timedelta(days=dates) today=datetime.datetime.strptime('1899-12-30','%Y-%m-%d')+delta return datetime.datetime.strftime(today,'%Y/%m/%d') list1 = [] for i in data['Sheet1'].columns: list1.append([])
for row in data['Sheet1'].values: for x in range(len(row)): realtime = date(row[x]) #转化为具体时间,调用date方法 list1[x].append(realtime) continue #遍历表格中的数据,将原值改为真实日期 i = 0 for row in data['Sheet1'].columns: for j in range(len(list1[i])): row[j].value = list1[i][j] i += 1 data.save(r'E:\work_hot\temp\docx\time_test1234.xlsx') #我这里另存了一份,也可以保存到原文件中
结果图: