如何使用Pandas操作数据

本文介绍了Pandas的主要数据结构Series和DataFrame,详细讲解了如何创建、操作和索引这两个数据结构,包括添加、删除列,数据排序以及统计计算。Pandas提供强大的分析功能,适合数据挖掘和分析。
摘要由CSDN通过智能技术生成

Pandas是一个强大的分析结构化数据的工具集;它的使用基础是Numpy(提供高性能的矩阵运算);用于数据挖掘和数据分析,同时也提供数据清洗功能。

一、数据结构

pandas的主要数据结构包括Series和DataFrame。

(1)Series

它是一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。Series的字符串表现形式为:索引位于左边,数据位于右边:

PandasSeries类对象可以使用以下构造方法创建:

class pandas.Seriesdata = Noneindex = Nonedtype = None,name = None,copy = Falsefastpath = False)data:表示传入的数据。 index:表示索引,唯一且与数据长度相等,认会自动创建一个从0~N的整数索引。

1、通过传入一个列表来创建一个Series类对象:

 2、除了使用列表构建Series类对象外,还可以使用dict进行构建:

 为了能方便地操作Series对象中的索引和数据,所以该对象提供了两个属性index和values分别进行获取。当某个索引对应的数据进行运算以后,其运算的结果会替换原数据,仍然与这个索引保持着对应的关系。

 (2)DataFrame

DataFrame是一个类似于二维数组或表格(如excel)的对象,它每列的数据可以是不同的数据类型。DataFrame的索引不仅有行索引,还有列索引,数据可以有多列:

 PandasDataFrame类对象可以使用以下构造方法创建:pandas.DataFrame(data = Noneindex = Nonecolumns = None,dtype = None,copy = False )index:表示行标签。若不设置该参数,则默认会自动创建一个从0~N的整数索引。columns:列标签。

 1、通过入数组来DataFrame类对象:

创建DataFrame类对象时

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值