十分钟搞定pandas(二)

合并

连接

pandas提供各种工具以简便合并序列,数据桢,和组合对象, 在连接/合并类型操作中使用多种类型索引和相关数学函数.

请参阅合并部分

把pandas对象连接到一起

连接

SQL样式合并. 请参阅 数据库style联接

添加

添加行到数据增. 参阅 添加

分组

对于“group by”指的是以下一个或多个处理

  • 将数据按某些标准分割为不同的组
  • 在每个独立组上应用函数
  • 组合结果为一个数据结构

请参阅 分组部分

分组然后应用函数统计总和存放到结果组

按多列分组为层次索引,然后应用函数

重塑

请参阅章节 分层索引 和 重塑.

堆叠

堆叠 函数 “压缩” 数据桢的列一个级别.

被“堆叠”数据桢或序列(有多个索引作为索引), 其堆叠的反向操作是未堆栈, 上面的数据默认反堆叠到上一级别:

数据透视表

查看数据透视表.

我们可以从此数据非常容易的产生数据透视表:

时间序列

pandas有易用,强大且高效的函数用于高频数据重采样转换操作(例如,转换秒数据到5分钟数据), 这是很普遍的情况,但并不局限于金融应用, 请参阅时间序列章节

时区表示

转换到其它时区

转换不同的时间跨度

转换时段并且使用一些运算函数, 下例中, 我们转换年报11月到季度结束每日上午9点数据

分类

自版本0.15起, pandas可以在数据桢中包含分类. 完整的文档, 请查看分类介绍 and the API文档.

转换原始类别为分类数据类型.

重命令分类为更有意义的名称 (分配到Series.cat.categories对应位置!)

重排顺分类,同时添加缺少的分类(序列 .cat方法下返回新默认序列)

排列分类中的顺序,不是按词汇排列.

类别列分组,并且也显示空类别.

绘图

绘图文档.

在数据桢中,可以很方便的绘制带标签列:

获取数据输入/输出

CSV

写入csv文件

读取csv文件

HDF5

读写HDF存储

写入HDF5存储

读取HDF5存储

Excel

读写MS Excel

写入excel文件

读取excel文件

陷阱

如果尝试这样操作可能会看到像这样的异常:

查看对照获取解释和怎么做的帮助

也可以查看陷阱.

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值