AI学习-Pandas数据处理分析

本文详细介绍了Pandas库中Series和DataFrame的创建、索引、取值、数据类型设定以及相关方法如平均值、最大值、排序和拼接。重点讲解了Series的标签索引和位置索引的区别以及DataFrame的使用方法,包括列选择和数据获取方式。
摘要由CSDN通过智能技术生成

#查看原属数据
data.values
#显示:array([4, 3, 5, 6, 1])

#查看索引
data.inedx
#显示:RangeIndex(start=0, stop=5, step=1)


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/b9c6e19027c14544a790b0720bf4b180.png#pic_center)


* 使用列表创建Series,并自动分配默认索引



#创建一维数组
data = [1, 2, 3, 4, 5]
s = pd.Series(data)


* 使用自定义索引创建Series:



#设置自定义索引
index = [‘a’, ‘b’, ‘c’, ‘d’, ‘e’]
data = [10, 20, 30, 40, 50]
s = pd.Series(data, index=index)
#使用list创建自定义索引
data=pd.Series([4,3,2,1],index=list(‘abcd’))


* 使用字典创建Series,字典的键成为Series的索引:



#设置自定义索引
data_dict = {‘apple’: 4, ‘banana’: 2, ‘orange’: 6}
s = pd.Series(data_dict)


* 指定数据类型



#设置数据类型为float
data = [1, 2, 3, 4, 5]
s = pd.Series(data, dtype=‘float’)


* 给Series命名



#设置seried名称
data = [1, 2, 3, 4, 5]
s = pd.Series(data, name=‘xiu’)


##### 2.2 Series的取值


​ series可以像narray数组一样通过使用索引的方式,其索引分为**位置索引**和**标签索引**。两种索引方式不同之处在于标签索引进行切片(获取其子集)时候 是左闭右闭,而位置索引是左闭右开。



index = [‘a’, ‘b’, ‘c’, ‘d’, ‘e’]
values = [10, 20, 30, 40, 50]
data = pd.Series(values, index=index)
display(‘根据 key 获取:’,data[‘a’])
#切片且标签索引 显示 [a ~ d]包含d的数据
display(‘切片获取:’,data[‘a’:‘d’])
display(‘索引获取:’,data[1])
#切片且位置索引 显示 [2 ~ 4)不包含4的数据
display(‘索引切片:’,data[2:4])


位置索引与标签索引有相同值 1,这时候 data[1]就不知道是按哪个 来获取,此时要使用 loc、iloc。


* loc 表示的是标签索引
* iloc 表示的是位置索引



data=pd.Series([5,3,2,5,9],index=[1,2,3,4,5])

#如果是位置索引1 则为5 如果是标签索引则是2 默认下边不会报错,但是默认使用标签索引
data[1] #等价于
data.loc[1]

#如果需要使用位置所以 用iloc
d

  • 10
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值