pandas
文章平均质量分 62
weijian001
这个作者很懒,什么都没留下…
展开
-
pandas中时间窗函数rolling的使用
在建模过程中,我们常常需要需要对有时间关系的数据进行整理。比如我们想要得到某一时刻过去30分钟的销量(产量,速度,消耗量等),传统方法复杂消耗资源较多,pandas提供的rolling使用简单,速度较快。函数原型和参数说明DataFrame.rolling(window, min_periods=None, freq=None, center=False, win_type=None, on=Non原创 2017-12-20 15:27:02 · 69641 阅读 · 1 评论 -
缓解pandas中DataFrame占用内存过大的问题
本文最后修改于2018-01-21,文章有问题或者转载请及时联系本人,如果对你有帮助,别忘了点下关注~0 背景在我们使用pandas进行数据处理的时候,有时候发现文件在本地明明不大,但是用pandas以DataFrame形式加载内存中的时候会占用非常高的内存,本文即解决这样的问题。1 原因如果是计算机相关专业的同学,你应该知道int8,int16,int64的区别。如果你忘记了,那...原创 2018-01-21 14:54:00 · 14367 阅读 · 0 评论 -
Pandas中使用loc将列表等集合赋值给行或列的每一个元素
0.背景在使用Pandas进行数据处理过程当中,有时候需要将数据的某一列都赋值为某一个列表的形式。但是如果列的元素个数与列表的元素个数相同时赋值,会导致列表中的每一个元素对应到了列的一个表格中(详情见下)。本文即解决这样的问题。1.对应赋值import pandas as pdimport numpy as npdata = pd.DataFrame({"A":np.aran...原创 2018-08-08 16:23:11 · 15704 阅读 · 0 评论 -
Pandas reshape相关函数介绍(pivot,pivot_table,stack,unstack,melt)
0.背景在Pandas的使用中,常常需要到行列切换的情况,即所谓的数据透视表,这里根据Pandas当中的此类专题进行总结,主要解析pivot,melt,stack,unstack几个函数的使用。**1.pivot(一定要看下pivot_table)pivot做的就是从源数据构造透视表的过程,透视表是在数据统计中一个数据汇总的方式。pivot使用例子如下所示。import pan...原创 2018-08-31 20:11:50 · 11193 阅读 · 3 评论