'''
Pandas 的数据结构:
Pandas 主要有 Series(一维数组),DataFrame(二维数组),Panel(三维数组),Panel4D(四维数组),PanelND(更多维数组)等数据结构。
其中 Series 和 DataFrame 应用的最为广泛。
- Series 是一维带标签的数组,它可以包含任何数据类型。包括整数,字符串,浮点数,Python 对象等。Series 可以通过标签来定位。
- DataFrame 是二维的带标签的数据结构。我们可以通过标签来定位数据。这是 NumPy 所没有的。
'''
#coding=utf-8
import pandas as pd
import numpy as np
#一、series创建
#1、从列表创建series
arr = [5,1,'m',3,4,'a']
s1 = pd.Series(arr)
print(s1)
#打印结果,前部分为索引,后部分为索引处对应值
#2、从Ndarray创建Series
n = np.random.random(5)
print(n)
index = ['m','b','c','d','e']
s2 = pd.Series(data=n, index=index)
print(s2)
#3、从字典创建series
d = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5}
s3 = pd.Series(data=d, index=index)
print(s3)
#二、Series基本操作
#1、修改series索引
print(s1)
s1.index = ['A','B','C','D','E','F']
print(s1)
#2、Series 纵向拼接
s4 = s1.append(s1)
print(s4)
#3、Series 按指定索引删除元素
print('Series 按指定索引删除元素')
s5 = s3
print(s5)
s5 = s5.drop('b')
print(s5)
#4、series修改指定元素,切片操作等
print('**************************')
s6 = s4
print(s6)
print(s6[:3])
print(s6.get('A'))
#二、Series 运算
d1 = {'a': 1, 'b': 2, 'c': 3, 'd': 4, 'e': 5} # 定义示例字典
s1 = pd.Series(d)
arr = [1,2,3,-4,5]
index = ['A','B','C','d','e']
s2 = pd.Series(data=arr, index=index)
print(s1)
print(s2)
#1、加法:Series 的加法运算是按照索引计算,如果索引不同则填充为 NaN(空值)。
print('***************')
s3 = s1.add(s2)
print(s3)
#2、减法:Series的减法运算是按照索引对应计算,如果不同则填充为 NaN(空值)。
print('*************')
s4 = s1.sub(s2)
print(s4)
#3、乘法:Series 的乘法运算是按照索引对应计算,如果索引不同则填充为 NaN(空值)。
print('*************')
s5 = s1.mul(s2)
print(s5)
#4、除法:Series 的除法运算是按照索引对应计算,如果索引不同则填充为 NaN(空值)。
print('***************')
s6 = s1.div(s2)
print(s6)
#5、中位数、求和、最大值、最小值,操作前需确认series中元素值是否均为数值型数据,否则会报错
print('*********************')
print(s1)
# s1['a'] = 'a'
# print(s1)
print(s1.median())
print(s2.sum())
print(s2.max())
print(s2.min())
pandas关于Series使用方法
最新推荐文章于 2024-05-14 11:00:23 发布