Pandas - 基本构造方式及其转换

本文介绍了Pandas的基础知识,包括Series和DataFrame两种数据结构。详细阐述了DataFrame的构造方式,如从dict、list和numpy ndarray创建,并讨论了DataFrame与Python类型之间的转换,如通过DF.T.to_dict()和DF.loc获取dict。
摘要由CSDN通过智能技术生成

目录

零、Pandas 基本介绍

一、Series - 一维数据结构

二、DataFrame - 二维数据结构

2-1 二维数据构造方式

2-1-2 从dict 构造

2-1-3 从 python list 构造

2-1-4 从 numpy ndarray 构造

三、DataFrame & Python Type 的相互转换 

3-0 DF构造

3-1 DF.T.to_dict() 获取python dict

3-2 DF.loc 获取 dict


零、Pandas 基本介绍

官方文档学习

pandas 适合的数据类型

  • 具有异构类型列的表格数据,如SQL表或Excel电子表
  • 有序和无序(不一定是固定频率)时间序列数据。
  • 具有行和列标签的任意矩阵数据(均匀类型或异构)
  • 任何其他形式的观察/统计数据集。实际上不需要将数据标记为放置在pandas数据结构中

pandas 应用

  • 轻松处理浮点中的缺失数据(表示为NaN)以及非浮点数据
  • 大小可变性:可以从DataFrame和更高维对象插入和删除列
  • 自动和显式数据对齐:对象可以显式对齐到一组标签,或者用户可以简单地忽略标签,让Series,DataFrame等在计算中自动对齐数据
  • 功能强大,灵活的分组功能,可对数据集执行拆分应用组合操作,以便聚合和转换数据
  • 可以轻松地将其他Python和NumPy数据结构中的不规则索引数据转换为DataFrame对象
  • 基于智能标签的切片,花式索引和 大数据集的子集化
  • 直观的合并和连接数据集
  • 灵活的数据集整形和旋转
  • 轴的分层标记(每个刻度可能有多个标签)
  • 强大的IO工具,用于从平面文件(CSV和分隔的),Excel文件,数据库加载数据,以及从超快HDF5格式保存/加载数据
  • 时间序列 - 特定功能:日期范围生成和频率转换,移动窗口统计,移动窗口线性回归,日期转换和滞后等

pandas 数据结构

  • Series - 1D labeled homogeneously-typed array (一维标记的均匀型阵列)
  • DataFrame - General 2D labeled, size-mutable tabular structure with potentially heterogeneously-typed column(二维 标记,尺寸可变的表格结构,具有潜在的异质型柱)

一、Series - 一维数据结构

官方文档 - series

二、DataFrame - 二维数据结构

官方文档 - dataframe

2-1 二维数据构造方式

2-1-2 从dict 构造

默认情况

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值