通过搜集得到企业的成立时间数据,但数据格式并不统一,如下所示:
通过分析,发现主要有这三种数据格式:YYYY年MM月D日、YYYY年、YYYY.MM.DD
统一转化为:YYYY-MM-DD
代码如下:
date_time = '1993年'
create_time = []
year = re.findall('.*?(?=年)',date_time)
month = re.findall('(?<=年).*?(?=月)',date_time)
day = re.findall('(?<=月).*?(?=日)',date_time)
if year:
if not month:
time_list = [year[0],'01','01']
else:
time_list = [year[0],month[0],day[0]]
else:
time_list = date_time.split('.')
'-'.join(time_list)
输出结果为: