Pandas 介绍,有点

 

pandas处理数据的优点:(集合操作,提升效率)

Pandas底层封装的是Numpy, 要想成数量级的提升Pandas的效率,应该直接从底层解决对ndarray的处理算法

在数据量大的时候,应尽量避免对df.loc ,df.iloc类定位函数的调用

Pandas适合处理多种类型的数据:(读取多种类型、格式的数据集,加载灵活)

  1. 具有不同数据类型列的表格数据,如SQL表Excel电子表

  2. 有序无序(不固定频率)的时间序列数据

  3. 带有行和列标签的任意矩阵数据

  4. 任何其他形式的观测/统计数据集

  5. Pandas主要包含三种数据结构,可以处理多维数据:分别是Series(一维),DataFrame(二维),Panel(三维)

  6. 可以轻易的处理浮点及非浮点数据类型的缺失值(NaN)

  7. 大小可变:DataFrame和Panel都可以删除或插入列

  8. 灵活强大的分组功能,可对数据集进行拆分组合操作

  9. 方便的将其他Python和NumPy数据结构中不同类索引的数据转换为DataFrame对象

  10. 基于智能标签的切片,花式索引,轻易从大数据集中取出子集

  11. 直观的合并,连接数据集

  12. 轻易的重新定义数据集形状和转置

  13. 轴(axes)的分层标签(使每个元组有多个标签成为可能)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值