2021-04-06 python数据处理系统学习(二十二)pandas其它函数
输入数据
data=pd.read_excel('附件1:123家有信贷记录企业的相关数据.xlsx',sheet_name=1,header=0)
输入结果如下:
如果有‘暂无’之类的字眼的话,可以在读入时用na_values=‘暂无’,进行处理,这样暂无会被转化成0.
1、datetime函数
对时间进行处理
data['开票日期']=pd.to_datetime(data['开票日期'],format='%Y-%M-%d')
data['开票日期']
Out[39]:
0 2017-07-18
1 2017-07-18
2 2017-07-18
3 2017-07-18
4 2017-08-07
210942 2019-04-17
210943 2020-01-10
210944 2017-12-15
210945 2018-12-29
210946 2019-12-18
Name: 开票日期, Length: 210947, dtype: datetime64[ns]
如果数据种有一些数据格式不太一样,则添加error=coerce,对每个不满足格式取值为0
2、计算时间差的方法
到当下时间的函数:
data['diff_day']=pd.datetime.today()
data['diff_day']
<ipython-input-42-05a95271faba>:1: FutureWarning: The pandas.datetime class is deprecated and will be removed from pandas in a future version. Import from datetime module instead.
data['diff_day']=pd.datetime.today()
Out[42]:
0 2021-04-06 19:08:21.783236
1 2021-04-06 19:08:21.783236
2 2021