前言
前不久碰见一个时间格式的巨坑,在这个地方谨记一下
一、重现问题
这个问题是怎么出现的呢,当时有个表A,和另外一个表B,他们两个联合起来去重,左联表C,将不在表C的数据录入到表C。
是吧,这个问题很简单吧,坑就坑在表A,和表B的格式都一样,唯独有一个字段不一样就叫他datatime字段,但是这个字段又不是分区字段。
表A的datatime字段格式是timestamp ,表B的格式是varchar(),但表C的datatime的时间格式是date哇,这就很难受了
这个地方提一句
A.datatime+0 这样timestamp 就会转换为date
但是也不是不能解决,两种方法,一种是直接cast,另外一种就是to_date
所以就一顿咔咔咔,ok,自测,觉得没啥问题,交给测试,再测一遍,卧槽突然发现了一个公元前的时间数据,什么鬼。
然后我就开始找BUG,到底是什么地方出现了这个问题,一开始我以为是我格式转换的问题,后面又测了一下,发现并没有,然后找啊找啊,就发现了
二、问题的解决
这个问题出现在那个字段是varchar2()类型的那张表上,他给的时间巨离谱,真的,你永远想象不到你面对的是什么,那个varchar2()类型的字段里面,起码有3种不同的时间格式数据
比如
22-Fer-22
20220222
2022-02-22
我真的吐了,这是什么东西啊,而且这部分数据比较少,我还是查了又查,真的是字符串类型,什么都可以往里面入是吧。
怪不得我用to_date和cast都不行,cast会将第一个转成公元前。。。。。
to_date需要确定格式类型
第二第三种可以to_date(to_char(datetime,‘yyyy-mm-dd’),‘yyyy-mm-dd’)这种方式来解决
害,巨烦这种,也不明确的。
后面我是怎么解决的呢,根据的是他们不同的长度,来判断使用哪种函数要求,像第一种使用了
to_date(to_char(cast(replace (dt.removetime,’ ‘,’’) as date),‘yyyy-mm-dd hh24’),‘yyyy-mm-dd hh24’)
to_date(to_char(cast(replace (dt.removetime,' ','') as date),'yyyy-mm-dd hh24'),'yyyy-mm-dd hh24')
对的,这里面还有空格,真的,只有你想不到的,我真的麻了
这个时候就像躺着