pandas使用记录

最新推荐文章于 2024-04-14 10:00:38 发布

火云明月

最新推荐文章于 2024-04-14 10:00:38 发布

阅读量184

点赞数

分类专栏： pandas 文章标签： pandas

本文链接：https://blog.csdn.net/qq_25850819/article/details/102925196

版权

pandas 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

1.选取某一区间上的值
比如选取time字段2019-3-1到2019-3-9时间内的所有行
start_time=pd.Timestamp(2019,3,1)
end_time=pd.Timestamp(2019,3,9)
df[df[‘time’].between(start_time,end_time, inclusive=True)]
总结：使用between可以避免使用比较运算
在这里插入图片描述
参考：https://www.geeksforgeeks.org/python-pandas-series-between/
2.将DataFrame数据存到文件
（1）to_csv
有用的参数：sep=’\t’
header=None
index=None
(2)to_excel
header=True, index=True,sheet_name=‘Sheet1’
(3)to_tsv
3.数据拼接
（1）pd.concat
pd.concat(objs, axis=0, join=‘outer’, join_axes=None, ignore_index=False, keys=None, levels=None, names=None, verify_integrity=False, copy=True)
objs：需要连接的对象，eg [df1, df2]；
axis axis = 0,：在水平方向进行连接。axis = 1, 垂直方向进行连接；
keys：可以给每个需要连接的df一个label；
join outer：index全部需要;
inner：表示只取index重合的部分。

4.时间问题

https://www.yiibai.com/pandas/python_pandas_timedelta.html
https://blog.csdn.net/qq_22238533/article/details/77110626
https://www.jb51.net/article/147429.htm