对于处理百万级别以上的数据,提供三个方法对比:
方法一大约耗时25分钟(for循环)
方法二大约耗时7分钟(for循环)
方法三大约耗时10秒(awk工具)
现在有个文本,里面数据是日-月-年,如下:
任务就是将上面的日期转换成YYMMDD格式。
例如第一个的17-MAR-20,则是转换成20200317
那么需求就很简单了,将中间的英文提取转换成数字月份,然后重新排列组合就行了。
转换后的结果:
方法一:
代码如下:
for tmp in `cat file |awk -F '[,]' '{print $3}' `;
do
month=`echo $tmp|awk -F '[-]' '{print $2}'`
#echo $month
case $month in
JAN|Jan|jan)
echo $tmp|awk -F '[-]' '{print 20$(3)01$1}'>>file_new
;;
FEB|Feb|feb)
echo $tmp|awk -F '[-]' '{print 20$(3)