在爬虫开发过程中,会遇到网站形形色色的时间格式,这是麻烦的。以下介绍两种比较常见的时间转换情况:
一、
把 "2022-07-05T03:56:26.000Z" 带有时区的时间转换成本地标准时间“2022-07-05 03:56:26”。【这种时间格式一般在获取接口的数据的时候,比较常见】
from datetime import datetime
def time_handler(target_time):
_date = datetime.strptime(target_time,"%Y-%m-%dT%H:%M:%S.%fZ")
end_time = _date.strftime("%Y-%m-%d %H:%M:%S")
print(end_time)
if __name__ == "__main__":
target_time = "2022-07-05T03:56:26.000Z"
time_handler(target_time)
二、 将外国银的英文格式转成标准的数字时间格式【这种一般在HTML标签的属性中,比较常见】:
import datetime
time2 = 'Jul 26, 2022 · 4:03 AM UTC'
time_format2 = datetime.datetime.strptime(time2, '%b %d, %Y · %H:%M %p UTC')
print(time_format2) #2022-07-26 04:03:00
常用时间转换:
三、时间戳转字符串
timestamp = 1668714300000
time_local = time.localtime(timestamp / 1000)
dt = time.strftime("%Y-%m-%d %H:%M:%S", time_local)
四、字符串转时间戳
time_str = "2022-11-17 07:49:59"
timeArray = time.strptime(time_str, "%Y-%m-%d %H:%M:%S")
timeStamp = int(time.mktime(timeArray))