用页面解析的方式从twitter爬下来的帖子时间有时候是中文的,如下:
由于时间处理的细节很多,所以在这里做一个小结,首先要明白处理的目标数据应该是24小时制,并且形式如下
format = "%Y-%m-%d %H:%M:%S"
也就是要将字符串转换为datetime.datetime类型
代码如下:
from datetime import datetime
format = "%Y-%m-%d %H:%M:%S"
def chineseTime2National(time):
if time[0] == "上":
time = time.replace(r'上午','').split(' ')
houmin = time[0].split(':')
if houmin[0] == '12':