关于Series序列对象

概念:

1.利用pandas库从外部读取数据到python形成的表格叫做DataFrame表格对象

2.Series序列对象即DataFrame表哥对象中的某一列数据

3.Series序列对象简称序列对象,其数据是Serie

获取序列对象的方法:


从表格对象中提取序列对象:表格对象【‘列名称’】

import pandas as pd
df = pd.read_excel(r'../dataset/超市销售数据.xlsx')
df['商品单价(美元)']

或者手动生成一个序列对象:pd.Series(列表对象)类生成 

 

series = pd.Series([1,2,3,4])
series

Series序列对象的属性

 

series = pd.Series([1,2,3,4])
series
print(series.values)#值
print(series.index)#索引
print(series.name)#名称
print(series.dtypes)#数据类型
print(series.size)# 数据个数

注意:打代码的同时注意大小写的切换,甚至括号和标点符号也要精确,中英文的切换非常重要,不然会导致后面步骤,接二连三错误!
Series序列对象中局部数据的访问方法
1.通过序列单个索引访问:序列对象[索引]

2.通过序列索引的切片访问:序列对象[索引1:索引2]

3.通过判断条件访问:序列对象[序列对象   逻辑判断符号  阀值]

series2 = pd.Series(['a','b','c'])
print(series2[0])
print('-'*20)
print(series2[0:2])
print('-'*20)
print(series2[series2!='a'])

 

Series序列对象的运算
序列对象和数字或者另一个序列之间可以进行基本的运算
series = pd.Series([1,2,3,4])
series2 = pd.Series([4,3,2,1])
print(series)
print(series+10)
print(series*10)
print(series+series2)
print(series.astype(str)+'个')
print(series>1)

 

Series序列对象常用方法

astype()

转换序列对象元素的数据类型

series = pd.Series([1,2,3])
print(series.astype(str))
series2 = pd.Series(['1','2','3'])
print(series2.astype(int))

 

Series序列对象的常用方法

value_counts()

用于统计序列中每个元素值出现了多少次

series =  pd.Series([1,2,3,3,3,4,4,4,4,5,5])
series.value_counts()

 

Series序列对象的常用方法

rank()  

返回序列中数据大小的排名

 注意:返回的是一个序列对象,索引和园序列相同

 

 

Series序列对象常用方法

round()

控制数字型序列的小数点位

 

Series序列对象常用方法

序列对象.str.方法名()

一系列用于批量处理字符串序列对象中元素的方法

注意:返回序列对象

注意:打代码的同时注意大小写的切换,甚至括号和标点符号也要精确

 

 

series3 = pd.Series(['1元','2元','3元'])
print(series3)
print(series3.str.replace('元','¥'))

 

series3 =  pd.Series(['张三','李四','王五'])
series3.str.contains('张')

 

注意:打代码的同时注意大小写的切换,甚至括号和标点符号也要精确

Series序列对象常用方法
agg()
对序列对象的元素进行加工的方法
注意:返回序列对象
语法:
1.序列对象.agg(lambda x:关于x的返回值)
2.序列对象.agg(定义好的加工函数)

 

#例一:要提取出字符串中的数字
series3 = pd.Series(['1元','2元','3元'])
print(series3.agg(lambda x:x.split('元')[0]))
#例二:将年龄转换为“成年”/“未成年”
series4 = pd.Series(['10岁','20岁','30岁'])
print(series4.agg(lambda x:'成年' if int(x.split('岁')[0])>18 else '未成年'))

 

 

注意:打代码的同时注意大小写的切换,甚至括号和标点符号也要精确

Series序列对象常用方法
max()/min)/mean)/median()/count)/var0/...
计算数字型序列对象中所有元素的统计量

 

series = pd.Series([1,2,3,2,5,6])
print(series)
print(series.max())
print(series.min())
print(series.sum())
print(series.count())
print(series.median())
print(series.var())
print(series.mode())

 

 

注意:打代码的同时注意大小写的切换,甚至括号和标点符号也要精确

注意:打代码的同时注意大小写的切换,甚至括号和标点符号也要精确

注意:打代码的同时注意大小写的切换,甚至括号和标点符号也要精确

文章到这里就结束啦!青山不改,绿水长流,我们下期见!

 

 

 

 

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值