python中pd series_Python 数据处理(三)——pd.Series

前言对于如何使用 R 来处理表格数据,相信你已经学习到很多了。下面我们的重点是介绍如何在 Python 中处理表格型数据,提到 Python 数据处理,那就不得不说 pandas 了。pandas 是 Python 数据处理的核心库,提供了快速、灵活、明确的数据结构,能够简单直接地处理结构性和关系型数据。panda 适用于很多不同类型的数据:具有不同类型的列的表格数据,如 Excel 和 SQL ...
摘要由CSDN通过智能技术生成

前言

对于如何使用 R 来处理表格数据,相信你已经学习到很多了。

下面我们的重点是介绍如何在 Python 中处理表格型数据,提到 Python 数据处理,那就不得不说 pandas 了。

pandas 是 Python 数据处理的核心库,提供了快速、灵活、明确的数据结构,能够简单直接地处理结构性和关系型数据。

panda 适用于很多不同类型的数据:

具有不同类型的列的表格数据,如 Excel 和 SQL 表

有序和无序(不一定是固定频率)的时间序列数据

具有行和列标签的任意矩阵数据(同类型或异构数据)

任何其他形式的观察/统计数据集。数据实际上根本不需要标记就可以放置到 pandas 数据结构中

Pandas 主要的数据结构是 Series(一维)与 DataFrame(二维),使用这两种数据结构就足以应对金融、统计、社会科学、工程等领域里的大多数数据了。

相较于 R 语言的 data.frame,DataFrame 提供了更加丰富的功能。

Pandas 是基于 NumPy 开发的,可以与其它第三方科学计算库完美集成。

能够熟练使用 pandas,处理数据将是事半功倍的,它的种种优点就不一一介绍了,下面开始正题吧。

安装

如果你系统中安装的是 Anaconda 环境的话,会自动安装 pandas、numpy、matplotlib 等常用的数据科学相关的库。

如果没有使用 Anaconda 的话可以使用

pip install pandas

一般我是推荐使用 Anaconda 环境的,是真的方便。还不知道如何安装配置 Anaconda 的话,可以找到我前面的文章,里面有详细的讲解。

数据结构

本节,我们先开始介绍 pandas 的基础数据结构

当然啦,使用这个包肯定得先导入了,同时我们也会使用到 numpy 中的一些函数,标准的导入方式是

In [1]: import numpy as np

In [2]: import pandas as pd

1. Series

Series 是带标签的一维数组,可以存储任意数据类型,如整数、浮点数、字符串、Python 对象等类型的数据。轴标签称为索引(index),可以使用 pd.Series 函数来创建

>>> s = pd.Series(data, index=index)

其中,data 可以是

python 字典

多维数组

标量值(如 5)

index 是对应的标签列表。根据不同的数据类型,分为以下几种情况:

多维数组

当 data 是多维数组时

  • 0
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值