1.选取某一区间上的值
比如选取time字段2019-3-1到2019-3-9时间内的所有行
start_time=pd.Timestamp(2019,3,1)
end_time=pd.Timestamp(2019,3,9)
df[df[‘time’].between(start_time,end_time, inclusive=True)]
总结:使用between可以避免使用比较运算
参考:https://www.geeksforgeeks.org/python-pandas-series-between/
2.将DataFrame数据存到文件
(1)to_csv
有用的参数:sep=’\t’
header=None
index=None
(2)to_excel
header=True, index=True,sheet_name=‘Sheet1’
(3)to_tsv
3.数据拼接
(1)pd.concat
pd.concat(objs, axis=0, join=‘outer’, join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)
objs:需要连接的对象,eg [df1, df2];
axis axis = 0,:在水平方向进行连接 。axis = 1, 垂直方向进行连接;
keys:可以给每个需要连接的df一个label;
join outer:index全部需要;
inner:表示只取index重合的部分。
4.时间问题
https://www.yiibai.com/pandas/python_pandas_timedelta.html
https://blog.csdn.net/qq_22238533/article/details/77110626
https://www.jb51.net/article/147429.htm