目录
在工作中,碰到了load CSV文件时,日期格式读写错误的情况,CSV文件的日期格式显示为date的格式,即为yyyy-MM-dd hh:mm:ss,但hive在读取日期格式的数据时,自行转换成了yyyy/MM/dd的这种字符串格式。
同时,我们也能看到,age字段也出现了编码错误的情况,这种情况在我们数据库读取时是经常会遇到的问题。
1、解决日期格式错误的问题
我们首先得明白,机器中存储日期是以什么方式或者什么数据来存储的?
我们首先应该有个概念,机器中存储日期数据是以时间戳的形式,并不是直接存储我们看到的日期那样的一个数据,时间戳是指格林威治时间1970年01月01日00时00分00秒(北京时间1970年01月01日08时00分00秒)起至现在的总秒数。
MySQL内部使用4个字节INT类型来存放时间戳数据: