前几天做项目遇到的一个bug,给大家分享一下。
出现bug的句子:unix_timestamp(nvl(b.access_time,'2018-08-27 24:00:00'),'yyyy-MM-dd HH:mm:ss')
这个句子在hive下跑完全没有问题,但是放到spark sql 里跑 就会出现数据性错误。
经过排查后发现是这个句子的问题。
将其改为 unix_timestamp(nvl(b.access_time,'2018-08-27 23:59:59.999'),'yyyy-MM-dd HH:mm:ss') 后,bug完美消除。