Pandas 第一节 概览

Pandas 是什么?

Pandas 是 Python 的核心数据分析支持库,提供快速、灵活、明确的数据结构,旨在简单直观地处理关系型、标记型数据。

Pandas 适用于处理以下类型的数据:

    1、与 SQL 或 Excel 表类似的,含异构列的表格数据;
    2、有序和无序(非固定频率)的时间序列数据;
    3、带行列标签的矩阵数据,包括同构或异构型数据;
    4、任意其它形式的观测、统计数据集, 数据转入 Pandas 数据结构时不必事先标记。

备注:同构和异构举例说明:

        如果你需要讨论一群鸟类或者一批飞机,那么这样的数据是同构的,比如包含鸟类的数组[Bird] 和包含飞机的数组 [Airplane]。有时候你想探讨的是这些空中家伙的共性 “飞翔”,因此你的数据源可能同时包含 Bird 和 Airplane,这样的数据源叫做异构数据。

Pandas 数据结构

维数名称描述
1Series带标签的一维同构数据
2DataFrame带标签的,大小可变的,二维异构表格

为什么有这么多个数据结构?

Pandas 数据结构就像是低维数据的容器。比如,DataFrame 是 Series 的容器,Series 则是标量的容器。使用这种方式,可以在容器中以字典的形式插入或删除对象。

通用 API 函数的默认操作要顾及时间序列与截面数据集的方向。多维数组存储二维或三维数据时,编写函数要注意数据集的方向,这对用户来说是一种负担;Pandas 将轴的概念转化成数组,简答的说让使用者少费点脑子,减少点脱发。

简答举例:

for col in df.columns:
    series = df[col]
    # do something with series

大小可变与数据复制

Pandas 所有数据结构的值都是可变的,但数据结构的大小并非都是可变的,比如,Series 的长度不可改变,但 DataFrame 里就可以插入列。

Pandas 里,绝大多数方法都不改变原始的输入数据,而是复制数据,生成新的对象。 一般来说,原始输入数据不变更稳妥。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

鬼王呵

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值