Python学习笔记(5-1):Pandas数据结构之Series
文章导读
- 课程难度:★★☆☆☆
- 预计学习时间:40分钟
- 简介:本节主要讲解了Pandas库中Series数据结构的相关基础知识,包括:(1)两种创建Series的方法;(2)Series的索引特性中,修改索引的两种方法及Series与字典间的联系与区别;(3)Series的运算;
- 重点涉及的函数和内容:(1)利用pd.Series()函数创建Series;(2).index和.rename()方法修改索引;(3)对Series的索引进行切片时,切片区间为闭区间;
前言
pandas是基于numpy构建的函数库,其数据结构有许多可以和numpy数组比较的特性。pandas库中有两个数据结构,一是一维的序列(pandas.Series),二是二维的数据框(pandas.DataFrame),二者主要用来处理类似于数据表类型的数据。结合它们的主要功能,从很通俗地理解上,DataFrame就是我们的表,Series就是我们的列。本节将分别从Series的创建、索引特性以及运算三个方面来进行介绍。
一、Series的创建:pd.Series()
Series是Pandas提供的一维数组,由**索引(index)和值(values)**两部分组成,类似于字典的结构,其中值的类型可以不同。创建Series,一般可以传入一个序列化对象(列表、numpy数组等)或是用一个字典构建一个Series
首先导入pandas:
import pandas as pd
1、传入序列化对象(列表或numpy数组)
使用pd.Series(data,index)
的方法创建一个Series,其中,data可以为列表或者numpy数组等序列化的对象或字典;index
默认为从0开始的非负整数,也可以自定义index。具体示例如下:
a = pd.Series([10,20,30]) #默认index
print(a,'\n')
b = pd.Series(np.arange(4),index=['num1','num2','num3','num4']) #传入numpy数组、自定义index
print(b)
输出结果如下:
0 10
1 20
2 30
dtype: int64
num1 0
num2 1
num3 2
num4 3
dtype: int32
2、传入字典
参数传入一个字典,将字典的“键”作为索引,来创建Series:
a = pd.Series({
'num1':10,'num2':20,'num3':30.,'num4':40})
print(a)
输出结果如下:
num1 10.0
num2 20.0
num3 30.0
num4 40.0
dtype: float64
二、Series的索引特性
对于一个Series,可用它的属性values
和index
来访问它的值和索引:
a = pd.Series([10, 20, 30])
print(a.values,'\n') # 从形式上像一个numpy数组
print(a.index)
输出结果如下:
[10 20 30]
RangeIndex(start=0, stop=3, step=1)
1、修改索引
Series的索引可以在创建时就定义,定义后也可以修改,一般有两种方法,一是通过.index
方法访问索引并赋值,二是使用.rename()
函数
(1)利用.index方法:
首先,我们可以使用.index
方法访问并赋值:
a = pd.Series([10, 20, 30])
a.index = ['num1', 'num2', 'num3']
print(a)
输出结果如下:
num1 10
num2 20
num3 30
dtype: int64
(2)利用.rename()函数
使用.rename()
函数对索引进行修改,传入的是一个字典,键和值分别是待修改的索引和替换的新索引值。.rename()
函数中有一个参数inplace
,默认值为False
,指示返回一个新对象,设置为True
时表示在原参数上进行直接修改。具体示例如下:
a = pd.Series([10, 20, 30])
a = a.rename({
0: 'num1',
1: 'num2',