AI学习-Pandas数据处理分析_国内ai pandas数据分析-CSDN博客

本文链接：https://blog.csdn.net/2401_83704125/article/details/137983251

本文详细介绍了Pandas库中Series和DataFrame的创建、索引、取值、数据类型设定以及相关方法如平均值、最大值、排序和拼接。重点讲解了Series的标签索引和位置索引的区别以及DataFrame的使用方法，包括列选择和数据获取方式。

摘要由CSDN通过智能技术生成

#查看原属数据
data.values
#显示：array([4, 3, 5, 6, 1])

#查看索引
data.inedx
#显示：RangeIndex(start=0, stop=5, step=1)


![在这里插入图片描述](https://img-blog.csdnimg.cn/direct/b9c6e19027c14544a790b0720bf4b180.png#pic_center)


* 使用列表创建Series，并自动分配默认索引

#创建一维数组
data = [1, 2, 3, 4, 5]
s = pd.Series(data)


* 使用自定义索引创建Series：

#设置自定义索引
index = [‘a’, ‘b’, ‘c’, ‘d’, ‘e’]
data = [10, 20, 30, 40, 50]
s = pd.Series(data, index=index)
#使用list创建自定义索引
data=pd.Series([4,3,2,1],index=list(‘abcd’))


* 使用字典创建Series，字典的键成为Series的索引：

#设置自定义索引
data_dict = {‘apple’: 4, ‘banana’: 2, ‘orange’: 6}
s = pd.Series(data_dict)


* 指定数据类型

#设置数据类型为float
data = [1, 2, 3, 4, 5]
s = pd.Series(data, dtype=‘float’)


* 给Series命名

#设置seried名称
data = [1, 2, 3, 4, 5]
s = pd.Series(data, name=‘xiu’)


##### 2.2 Series的取值


 series可以像narray数组一样通过使用索引的方式，其索引分为**位置索引**和**标签索引**。两种索引方式不同之处在于标签索引进行切片(获取其子集)时候 是左闭右闭，而位置索引是左闭右开。

index = [‘a’, ‘b’, ‘c’, ‘d’, ‘e’]
values = [10, 20, 30, 40, 50]
data = pd.Series(values, index=index)
display(‘根据 key 获取：’,data[‘a’])
#切片且标签索引显示 [a ~ d]包含d的数据
display(‘切片获取：’,data[‘a’:‘d’])
display(‘索引获取：’,data[1])
#切片且位置索引显示 [2 ~ 4)不包含4的数据
display(‘索引切片：’,data[2:4])


位置索引与标签索引有相同值 1，这时候 data[1]就不知道是按哪个 来获取，此时要使用 loc、iloc。


* loc 表示的是标签索引
* iloc 表示的是位置索引

data=pd.Series([5,3,2,5,9],index=[1,2,3,4,5])

#如果是位置索引1 则为5 如果是标签索引则是2 默认下边不会报错，但是默认使用标签索引
data[1] #等价于
data.loc[1]

#如果需要使用位置所以用iloc
d