python中datetime是比较常用的,平时用起来也没什么问题,但是今天2020年2月29日服务器却开始报错了,这里有个平时难以注意的坑
服务器上跑的是新浪网的爬虫,抓取的页面信息中带有日期 XX月XX日,需要strfptime转化一下,型如
import datetime
datetime.datetime.strptime('(02月29日 10:47)', '(%m月%d日 %H:%M)')
这里会报:ValueError: day is out of range for month
debug一下可以发现,datetime在处理未提供年份的日期时候,是按照如下图所示的逻辑处理的
注意断点处,将默认年设置为了1900,至于原因官方也在注释中声明了: ensure that February 29th is smaller than March 1st,可惜的是1900是平年,进而导致1900-02-29转化datetime错误。
这种问题,没有通用的处理方法,主要是业务上限制这个时间的使用,如果业务数据都是今年的那么直接获取当前年份传进去即可,如果处理老数据再涉及到时间前后对比的话就麻烦了,用当前时间不行,不用当前时间又会有影响,只能针对性的对具体业务场景写一些针对性的逻辑来处理。