pandas的定义以及pandas的Series的初步使用(一)

一、什么是pandas?

pandas是一种Python数据分析的利器,是一个开源的数据分析包,最初是应用于金融数据分析工具而开发出来的,因此pandas为时间序列分析提供了很好的支持。pandas是PyData项目的一部分。

官网:http://pandas.pydata.org/
官方文档:http://pandas.pydata.org/pandas-docs/stable/

二、pandas基本数据结构

pandas中主要有两种数据结构,分别是:Series和DataFrame。
Series:一种类似于一维数组的对象,是由一组数据(各种NumPy数据类型)以及一组与之相关的数据标签(即索引)组成。仅由一组数据也可产生简单的Series对象。注意:Series中的索引值是可以重复的。
例如:

通过pd.Series()创建了一个Series对象,进行输出。发现输出结果是一个竖立的数组,且有index
结果:通过pd.Series()创建了一个Series对象,进行输出。发现输出结果是一个竖立的数组,且有index(索引值)

DataFrame:一个表格型的数据结构,包含有一组有序的列,每列可以是不同的值类型(数值、字符串、布尔型等),DataFrame即有行索引也有列索引,可以被看做是由Series组成的字典。
通过pd.DataFrame创建了一个DataFrame对象,进行输出。发现输出结果是一个表格,既有行索引,又有列索引。
结果:通过pd.DataFrame创建了一个DataFrame对象,进行输出。发现输出结果是一个表格,既有行索引,又有列索引。

三、Series的增删查改

1、series的创建
通过一维数组的方式创建

series对象的创建
通过字典的方式创建
通过字典创建Series对象并且查询index、values、dtype属性值
通过字典创建Series对象并且查询index、values、dtype属性值
2、series的查询
pan1Series对象的dtype、values、index属性值的输出
Series值的获取
Series值的获取主要有两种方式:
通过方括号+索引的方式读取对应索引的数据,有可能返回多条数据
在这里插入图片描述
通过方括号+下标值的方式读取对应下标值的数据,下标值的取值范围为:[0,len(Series.values));另外下标值也可以是负数,表示从右往左获取数据
在这里插入图片描述
Series获取多个值的方式类似NumPy中的ndarray的切片操作,通过方括号+下标值/索引值+冒号(:)的形式来截取series对象中的一部分数据
在这里插入图片描述

3、series的改
修改index索引:通过数组创建Series的时候,如果没有为数据指定索引的话,会自动创建一个从0到N-1的整数索引;当Series对象创建好后,可以通过index修改索引值。
修改index属性的值
注意:在创建Series对象的时候可以直接修改index属性值,和dtype属性值。例如:
在创建的时候直接修改dtype、index属性值
4、Series的运算
NumPy中的数组运算,在Series中都保留了,均可以使用,并且Series进行数组运算的时候,索引与值之间的映射关系不会发生改变。
注意:其实在操作Series的时候,基本上可以把Series看成NumPy中的ndarray数组来进行操作。ndarray数组的绝大多数操作都可以应用到Series上。
示例:

在这里插入图片描述
示例2
在这里插入图片描述
5、 Series及其索引的name属性
Series对象本身以及索引都具有一个name属性,默认为空,根据需要可以进行赋值操作
示例在这里插入图片描述
6、Series缺失值检测
pandas中的isnull和notnull两个函数可以用于在Series中检测缺失值,这两个函数的返回一个布尔类型的Series
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值