有这样一个需求, hdfs 每 5 分钟存一个文件,文件就是 yyyymmddmi 的格式
比如
201901201535.txt
201901201540.txt
而我需要把这些文件录入到库中。比如现在是 2019 - 01 - 20 15 : 42 。
201901201540.txt 才刚刚形成,还有很多数据没有录入到 hdfs 完毕。
因此我现在不能立即录入 201901201540.txt ,只录入 201901201535.txt 文件。
那么我现在怎么根据当前时间自动判断录入哪一个文件呢?
分析:
对于时间的一些换算,计算,我们要记得每一种语言,基本上都会提供一个叫做时间戳的东西。
把时间变成时间戳的话,就能转换成纯粹的数学运算。
上面的问题就能转换成一个小学数学求整数的问题。
比如,上面这个问题就相当于变成了,
21--》15
37--》30
42--》35
这个问题的答案,我想稍微想一想就知道了
((a-5) 整除 5 )*5
整除,在我们的语言中大部分用 "\" 替代,所以不需要写逻辑,只接一个四则运算就解决了。
比如shell中。这个公式换算成代码就是:
# 获取当前时间戳
timestamp=`date +%s` # 相当于 a
# 获取 5 分钟之前的时间戳
timestamp_five_mins_ago=`expr $timestamp - 300` # 相当于 a-5 。因为我们这里只要精确到分钟,所以时间戳精确到秒就可以了, 5 分钟就是 300 秒。
# 取整
timestamp_five_mins_ago_int=$(((timestamp_five_mins_ago/300)*300)) # 相当于 ((a-5) 整除 5 )*5
#最后再加时间戳换回来
# 时间戳转换成日期
time_five_mins_ago_int=`date -d @${timestamp_five_mins_ago_int} "+%Y%m%d%H%M"`
来自 “ ITPUB博客 ” ,链接:http://blog.itpub.net/69904754/viewspace-2564230/,如需转载,请注明出处,否则将追究法律责任。
转载于:http://blog.itpub.net/69904754/viewspace-2564230/