一、问题描述
笔者需要将时间戳数据转换成日期格式,使用的是pd_to_datetime进行转换,得到了如下图结果
data["date_"] = pd.to_datetime(data["timestamp"],unit = "ms")
一眼看上去是转换正确了,但使用线上的工具进行验证时 出现了不一致性
二、原因分析
线上的工具和使用pd_to_datetime转换得到的时间刚好相差8个小时,初步感觉是时区出现了问题,希望通过阅读文档找到如何去修改时区的属性
但经过查看pd_to_datetime文档,发现有一个utc的字段,来控制时区,也改变不了
在网上查阅其他资料后,发现有一个老哥在也遇到过这个问题:链接 ,感觉遇到了救星,但一翻尝试后,发现,这个方法挺复杂的,不如我写个函数直接搞定
三、解决办法
方法一
继续使用pd.to_datetime,使用orgin字段控制一下起始时间,暂没有找到优雅的直接控制时区的办法
data["date_orgin"] = pd.to_datetime(data["timestamp"],unit = "ms",origin = "1970-01-01 08:00:00")
方法二
使用apply方法加自己自定义一个函数
def stamp2time(timeStamp): #时间戳转日期函数
"""
功能:将时间戳转换成日期函数 例如:1606708276268 ==》2020-11-30 11:51:16
参数:timeStamp 时间戳,类型 double 例如:1606708276268
返回值:日期, 类型:字符串 2020-11-30 11:51:16
"""
time_local = time.localtime(timeStamp/1000)
dt = time.strftime("%Y-%m-%d %H:%M:%S", time_local)
return dt
data['date_func'] = data["timestamp"].apply(stamp2time)