python使用pandas和datetime处理时间格式

问题场景:

  1. 爬虫爬取用户微博的发布时间,保存在csv中。
    保存格式为2020-01-01 10:10
    现需要分别提取 年 月 日 时间 做分析;
  2. 同时已知年月日,希望得到该日是周几。

code

import pandas as pd
from datetime import datetime

t = pd.read_csv('mi10_user_publish_time.txt', encoding='utf-8')
# txt中第一行有表头pubtime,所以才有下一行。若文件中每行为纯数据,则直接用t亦可。
pubtime=t.pubtime
# print(pubtime)

#pub_time = pd.to_datetime(pubtime, format="%Y-%m-%d %H:%M")
df_time=pd.DatetimeIndex(pubtime)	
#用DatetimeIndex才可分别提取year hour等,很奇怪。

#print(type(df_time))
#print(df_time.hour)

#以下是将每天对应的周几存到list中
w=[]
for i in df_time:
    #print(i)
    w.append(datetime.strptime(str(i), '%Y-%m-%d %H:%M:%S').weekday()+1)

print(w)

输出:

时间格式就不谈了,可以用year month hour等属性直接调用了。
周几输出如下:

[3, 6, 5, 2, 0, 6, 0, 0, 0, 6, 5, 2, 1, 6, 6, 0, 5, 4, 3, 3, 2, 0, 0, 3, 3, 3, 2, 1,等等等等]

0-6 对应周一到周日。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值