perl 中的日期处理

转载 2007年09月27日 14:38:00


日期是如何表示的,表示日期的方式多种多样:
"18 Jan 1973" ,"18/01/1973" ,"01/18/1973" ,"Jan 18 1973" ,"18-01-73" ,"18-01-1973" ,"01/73",
其中,一些格式适合用在email中,一些适用在HTTP头中, 一些适合用在支票簿中,另外一些则仅适用于信用卡,其中一些格式含义不清(如"01-06-1973"是表示6月1日呢,还是表示1月6日呢?) 如果不规定日期的表示形式,是很难处理日期的。

如果你想了解"18 Jan 1973"和"6 Sep 1950"之间的区别,你需要把它们转换为数字表示。Unix 内部使用纪元秒表示时间。日期和时间加起来表示之自格林威志时间1970年1月1日午夜时分(纪元)到当前时刻之间的秒数。"18 Jan 1973" (假定为午夜时分) 的纪元秒为96163200。在该系统中,午夜表示一天的开始时刻。

让我们生成一个日期
通过Perl中提供的gmtime函数,你可以自己来验证这点。给定一个用以表示自从纪元以来的秒数的整数,通过gmtime函数可以计算出代表相应的日期和时刻,例如:

perl -le 'print scalar gmtime 96163200'

Thu Jan 18 00:00:00 1973

如果你调用 gmtime() 函数,你会得到一系列值的列表:

包括时,分,秒, 日期,月份,年份等等。

perl -le 'print join(",", gmtime 96163200)'

0,0,0,18,0,73,4,17,0

前面3个0分别表示秒,分,时。小时是从0-23,故下午是12时往后。第4个数表示该月中的天数(本例中为18号)。第5个数表示月份,从0开始(代表1月份)。之所以从0开始,是因为月份对应着月份数组的下标:

@months = qw(Jan Feb Mar Apr May Jun
Jul Aug Sep Oct Nov Dec); $month =
(gmtime 96163200)[4]; # "Jan"

年份 (本例中为73)的表示有点特殊。它并不是年份的最后两位数字。它表示从1900年开始的年份。为什么要这样表示呢?这是因为 C语言就是这样处理的。Perl试图使得其库和系统调用尽量接近操作系统的处理方式。

所以,如果你想输出4位数的年份,表示如下:

$year = (gmtime 96163200)[5] + 1900;

如果你不了解这种处理方式,就会制造出Y2K问题,你也许会这样写:

$year = "19" . (gmtime 96163200)[5];

# 出错! 2000年将变为19100

对于gmtime()函数的返回值还没有介绍完,还有4, 17, 和 0这3个数。它们分别表示一星期中的第几天 (星期日为0),一年中的第几天(0 表示一年中的第一天), 以及是否采用夏时制(表示不采用,正数表示采用,负数表示不可知)。
现在!现在!现在!
Perl中的time() 函数返回以纪元秒形式表示的当前日期和时间。如果你打算把它转换为字符串,就可使用gmtime() 和localtime() 函数:

$now = localtime(time());
($sec, $min, $hour, $day, $mon, $year, $wday, $yday, $isdst) = localtime(time());

如果调用 localtime() 或gmtime() 时不带参数,它将自己调用time()

$now = localtime();
($sec, $min, $hour, $day, $mon, $year, $wday, $yday, $isdst) = localtime();

常见的日期和时间操作
如果你打算计算两个时刻之间的时间段,只需将它们转换为相应的纪元秒,然后两数相减即可:

$difference_in_seconds = $later_datetime -
$earlier_datetime;

要把秒转换为分,时,或天数,只需要分别将它们除以60, 3600 和 86400 即可:

$difference_in_minutes = $difference_in_seconds / 60;
$difference_in_hours = $difference_in_seconds / 3600;
$difference_in_day = $difference_in_seconds / 86400;

反过来做,你也可以回答如下问题:"4天后是几号?":

$then = time() + 86400 * 4;
print scalar localtime $then;

它给出的答案精确到秒。例如,如果4天后的纪元秒值为932836935, 你可以输出日期的字符串如下;

Sat Jul 24 11:23:17 1999

如果你打算输出那个日期的午夜时分 (如"Sat Jul 24 00:00:00 1999") 使用如下模块:

$then = $then - $then % 86400;

# 去掉那个日期的尾巴

类似地,你可以用四舍五入法,输出最靠近午夜时分的日期:

$then += 43200; # add on half a day
$then = $then - $then % 86400;
# truncate to the day

如果你的时区距离GMT为相差偶数个小时,这就管用了。并不是所有的时区都是很容易处理的。你所真正需要的是在你自己的时区内计算纪元秒,而不是在GMT中计算。

Perl 中的名为Time::Local的模块,可以提供两个函数 timelocal() 和timegm()。其返回值同 localtime() 和gmtime() 一样。

use Time::Local;
$then = time() + 4*86400;
$then = timegm localtime $then;
# local epoch seconds
$then -= $then % 86400;
# truncate to the day
$then = timelocal gmtime $then;
# back to gmt epoch seconds
print scalar localtime $then, "/n";

日常生活所用的日期和时间的表示
你已经级掌握了时,分,年等值的含义,也了解了纪元秒的含义。而日常生活中的日期和时间是用字符串来表示的,你怎样才能把日常所用的日期和时间串格式转换成纪元秒呢?

方法之一是写出语法分析小程序,该方法灵活而快速:

use Time::Local;
@months{qw(Jan Feb Mar Apr May Jun
Jul Aug Sep Oct Nov Dec)} = (0..11);
$_ = "19 Dec 1997 15:30:02";
/(/d/d)/s+(/w+)/s+(/d+)/s+(/d+):(/d+):(/d+)/
or die "Not a date";
$mday = $1;
$mon = exists($months{$2}) ? $months{$2} : die "Bad month";
$year = $3 - 1900;
($h, $m, $s) = ($4, $5, $6);
$epoch_seconds = timelocal($s,$m,$h,$mday,$mon,$year);

一个更通用些的方法,是从CPAN(Perl综合网)中安装Date::Manip 模块。

use Date::Manip;
$epoch_seconds = UnixDate("19 Dec 1997 15:30:02","s");

注意,由于 Date::Manip是个大模块,使用该模块时,将会增加你的程序的启动时间。其中一个原因是 Date::Manip将对多种不同的格式进行识别,如:

"today"
"now"
"first sunday in april 2000"
"3:15, today"
"3:15pm, first sunday in april 2000"
"2000/01/18 09:15"Date Manipulation
2036, 2037, 2038, ..., 1901?!

大多数C程序把纪元秒存为有符号整数,可表示正的和负的日期,但计算机存储器所表示的整数大小是有限的,用有限的位数来表示秒。这就是说,我们在计算纪元秒时,所表示的日期是有限制的。

确切的限度取决于你的机器所能表示的整数的位数。 Perl最多以32位的长度存储整数。粗略地讲,有一位用来表示正负号,其余31位来表示数。如果8位,你可以存储的最大数是255,即2的8次方减1。故Perl中所存储的32位符号数中的最大数为:

print 2**31-1, "/n";
2147483647

这个数字对应了哪个日期呢?

print scalar(gmtime 2**31-1), "/n";
Tue Jan 19 03:14:07 2038

在那个时刻的1秒之后会发生什么呢?

print scalar(gmtime 2**31), "/n";
Fri Dec 13 20:45:52 1901

啊!发生了什么?对于32位有符号整数来说, 2**31太大了。它"翻卷过去了",其符号位被置为负号,因而成为了所能表示的最大负数。这对应于1970年开始时刻之前的秒的最大值。

其结果说明了什么呢?你不能存储gmtime(2**31)之前或gmtime(2**31-1)之后的以纪元秒表示的日期。

你可千万不要想不开,这可不是什么大问题。如果你要用到32位有符号整数表示的纪元秒以外的时间,你只需要改变你的表示方式,你可从CPAN中找到不少日期模块,其中的Date::Calc 和Date::Manip 很可能是功能最强的两个模块。

这两个模块使用自己的日期表示方式,以避免Y1901-Y2038 的限制。Date::Manip 使用罗马历法,从公元 0000 到公元9999。Date::Calc 也使用罗马历法,可表示的年份从1 到32767。

总结

不同的国家在不同的时期采用了罗马历法,你应该注意你使用的日期是采用的是什么历法。

在UNIX机器内部,每过1秒,纪元秒的计数器加1,如果该值是以32位有符号整数格式表示的,系统在2038年的日期将会出现翻转现象,预计大多数操作系统将在2038年之前改正这一问题。

对于在1902-2037范围内的日期和时期表示, 把它们转换为纪元秒,要存取这些数,你只需使用整数算术运算,gmtime() 和 localtime()函数,以及标准的Time::Local模块。如果要对该范围以外的日期进行计算或者要分析某特殊的日期格式,你可以使用CPAN中的Date::Manip 和Date::Calc模块。

进一步的阅读

Perl Cookbook的第三章谈论了日期和时间, perlfunc 手册( 或Programming Perl的第三章) 介绍了gmtime() 和localtime() 函数。. CPAN是指Perl综合网。

 

相关文章推荐

Perl 处理日期的自定义函数

 转载:http://blog.chinaunix.net/uid-7591044-id-3060595.html 最近做东西老用到处理时间的问题,索性写几个函数。 #!/usr/b...

perl中utf-8编码的处理

为了比较方便,考虑这样一个应用:把html页面中的所有非汉字字符全部去掉。 这里顺便告诉大家一个秘诀,只要文本被perl 按正确编码解释后,利用/w就可以匹配一个字母、数字、_、汉字,这个特性是不...

perl的时间处理之localtime和strftime

大家都是使用的 localtime 来取得当地日期时间和日期。这个函数如果在标量环境时,会以字符串的形式来传回目前的时间和日期 。默认的 localtime 的函数是以 1970 到今天的秒来做整数计...
  • cnki_ok
  • cnki_ok
  • 2015年03月20日 17:50
  • 708

perl 字符串处理函数

=================================================================================From: http://forger...

知名网站分享:PHP代替Perl,Redis置换MySQL,日处理过亿PV

知名网站分享:PHP代替Perl,Redis置换MySQL,日处理过亿PV 发表于2013-08-02 14:00| 6716次阅读| 来源个人博客| 15 条评论| 作者Justin ...

perl处理base64编码解码问题

Base-64编码 Base64是网络上最常见的用于传输8Bit字节代码的编码方式之一,大家可以查看RFC2045~RFC2049,上面有MIME的详细规范。 Base64要求把每...

Perl字符串处理

众所周知Perl处理字符串的功能非常强大,Perl(Practical Extraction and Reporting language)处理格式的功能也非常强大,这里我们就开始学习一些Perl的格...

perl对微信语音信息的处理,以及将语音信息合并

小弟,最近迷恋上了微信,与女友聊天基本都是微信,但是一条一条信息听起来太麻烦,小弟就设想能否将信息一条一条按照顺序,合并起来。但是不得不吐槽的是微信的语音存放文件夹太恶心了,名字毫无顺序,每个文件夹下...
  • zhajio
  • zhajio
  • 2013年06月16日 10:40
  • 1213

Perl的时间处理

http://blog.csdn.net/zhangxinrun/article/details/5886950 1) Date::Calc这里是冠军模块: use str...
  • jdc0109
  • jdc0109
  • 2013年10月29日 14:44
  • 606

perl使用Getopt::Long模块,处理命令行参数

perl脚本的命令行参数处理办法 代码解释 脚本使用 参考文档perl脚本的命令行参数处理办法perl自带Getopt::Long模块,就是一个函数库。 还有一个Getopt::Std模块,不过有了...
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:perl 中的日期处理
举报原因:
原因补充:

(最多只允许输入30个字)