好吧,工作中碰上了这种情况:
这是用pandas读取表格后,日期/时间列里面的东西。。
>>> order_only_asin_unhvp['date/time']
4 Jul 29, 2020 6:18:30 AM PDT
>>> type(order_only_asin_unhvp['date/time'][4])
<class 'str'>
更恶心的是,我还得把这个日期给重新换成日期格式才能继续干活。。
看来真就只能做切割了。。。
目前来说思路也不是没有,就是比较麻烦罢了。。
以下仅记录当前思路,如果看到只有文字没代码,表示我还没想好,或者该想法还没被我实现。。
第一步,做切割。
一整列都是字符串,而且字数相等,切起来难度也不高。。
后续要用到的也就年份,月份,日份三项内容而已,
而时间,上下午,时区都是没用的累赘,就先不管了。。
第二步,处理月份
反正12个月也不是很多,干脆做个字典,完了再以pd[‘col_name’].str.replace()的方法将英文缩写的月份替换成数字格式的月份。。
第三步,合成日期
首先当然是把切好的年份,月份,日份三列astype(str)一下,免得变成算术相加。。
三列拼接,问题不大。。
emmmm,应该完事了吧。。
想法记录完成,干活去了。
实现了再回来更新具体实施的代码。