pandas之Series

最新推荐文章于 2024-01-02 06:09:21 发布

Android_Study_OK

最新推荐文章于 2024-01-02 06:09:21 发布

阅读量232

点赞数

分类专栏： python

本文链接：https://blog.csdn.net/Android_Study_OK/article/details/89090522

版权

python 专栏收录该内容

0 篇文章 0 订阅

订阅专栏

pandas之Series

一维数据，带标签的数组

1. 创建Series

1.1 通过list 创建Series

需要指定 data，index，data和index是list类型或者 np.arange

s1 = pd.Series(np.arange(10), index=list(string.ascii_uppercase[:10]))
s2 = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
s3 = pd.Series([1, 2, 3], index=np.arange(3))
s4 = pd.Series([1, 2, 3], index=list("efg"))

1.2 通过字典创建Series

直接传入字典即可,key为index，value为data

dict = {"name": "Jack", "age": 30, "tel": 10086}
s5 = pd.Series(dict)

1.3 通过旧的Series创建新的Series

可以修改Series的index,如果加入了新索引，对应的value为Nan,
注意NaN是float,pandas会自动更改为float

s6 = pd.Series(s1, index=list(string.ascii_uppercase[:15]))
s7 = s6.astype(object) #修改元素数据类型

2. Series的索引

2.1 通过所在的位置取值

s1[3]

3

2.2 通过索引名称取值

s1['C']

2

3. Series的切片

3.1 取前两行

s1[0:2]) # 通过位置-取前两行

3.2 取不连续多行，注意嵌套[]

s1[[1, 8]])  # 通过位置-取不连续多行
s1[['A', 'C', 'F']])  # 通过索引名称-取不连续多行

3.3 取出所有行，步长为2

s1[0::2] # 取出所有行，步长为2

3.4 按照条件，取出对应行

s1[s1 > 5]  # 按照单个条件取
s1[(s1 > 5) & (s1 % 2 == 0)] # 按照多个条件取

4. Series取出来所有索引index

4.1 所有索引index

index是一个类型

type(s1.index)
s1.index

4.2 遍历所有的index

for i in s1.index:
    print(i)

4.3 index类型转为list

list(s1.index)

[‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’, ‘G’, ‘H’, ‘I’, ‘J’]

4.4 index可以直接切片

s1.index[0::2]

Index([‘A’, ‘C’, ‘E’, ‘G’, ‘I’], dtype=‘object’)

4.5 得到所有index的长度

en(s1.index)

10

5. Series取出来所有值values

s1.values
type(s1.values)

[ 1 3 5 7 9 2 4 6 8 10]
<class ‘numpy.ndarray’>

6. where 条件

6.1 所有大于3的元素，都变成10

s1.where(s1 > 3, 10)

A 10
B 10
C 5
D 7
E 9
F 10
G 4
H 6
I 8
J 10

6.2 所有大于5的元素，保持不变，其他的都为Nan

s1.where(s1 > 5)

A NaN
B NaN
C NaN
D 7.0
E 9.0
F NaN
G NaN
H 6.0
I 8.0
J 10.0

6.3 所有大于5的元素都变为Nan，其余的保持不变

s1.mask(s1 > 5)

A 0.0
B 1.0
C 2.0
D 3.0
E 4.0
F 5.0
G NaN
H NaN
I NaN
J NaN

附代码

import pandas as pd
import numpy as np
import string

# pandas之Series
# 一维数据，带标签的数组

# 1. 创建Series

# 1.1 通过list 创建Series (需要指定 data，index)
#     指定indexdata和index是list类型或者 np.arange
s1 = pd.Series(np.arange(10), index=list(string.ascii_uppercase[:10]))
s2 = pd.Series([1, 2, 3], index=['a', 'b', 'c'])
s3 = pd.Series([1, 2, 3], index=np.arange(3))
s4 = pd.Series([1, 2, 3], index=list("efg"))
print(s1)
print(s2)
print(s3)
print(s4)

# 1.2 通过字典 创建Series(直接传入字典即可,key为index，value为data)
dict = {"name": "Jack", "age": 30, "tel": 10086}
s5 = pd.Series(dict)
print(s5)

# 1.3 通过旧的Series创建新的Series
# （可以修改Series的index,如果加入了新索引，对应的value为Nan,
#   注意NaN是float,pandas会自动更改为float）

s6 = pd.Series(s1, index=list(string.ascii_uppercase[:15]))
print(s6)

# 1.3.1 修改元素数据类型
# s7 = s6.astype(int) 因为存在nan，所以不能指定为int
s7 = s6.astype(object)
print(s7)
print("*" * 100)

# 2. Series的索引

# 2.1 通过所在的位置取值
print(s1[3])

# 2.2 通过索引名称取值
print(s1['C'])

# 3. Series的切片

s1 = pd.Series([1, 3, 5, 7, 9, 2, 4, 6, 8, 10], index=list(string.ascii_uppercase[:10]))
print(s1)
# 3.1 输入 start end  步长

print(s1[0:2])  # 通过位置-取前两行
print(s1[[1, 8]])  # 通过位置-取不连续多行
print(s1[['A', 'C', 'F']])  # 通过索引名称-取不连续多行

print(s1[0::2])  # 取出所有行，步长为2

print(s1[s1 > 5])  # 按照单个条件取
print(s1[(s1 > 5) & (s1 % 2 == 0)])  # 按照多个条件取

# 4. Series取出来所有索引index 是一个类型

# 4.1 所有索引index
print(type(s1.index))

print(s1.index)

# 4.2 遍历所有的index
for i in s1.index:
    print(i)

# 4.3 index类型转为list
print(list(s1.index))

# 4.4 index可以直接切片
print(s1.index[0::2])

# 4.5 得到所有index的长度
print(len(s1.index))

# 5. Series取出来所有值values 是一个类型

print(s1.values)
print(type(s1.values))

# 6. where 条件

# 6.1 所有大于3的元素，都变成10
print(s1.where(s1 > 3, 10))

# 6.2 所有大于5的元素，保持不变，其他的都为Nan
print(s1.where(s1 > 5))

# 6.3 所有大于5的元素都变为Nan，其余的保持不变
s1 = pd.Series(np.arange(10), index=list(string.ascii_uppercase[:10]))
print(s1.mask(s1 > 5))

Android_Study_OK

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
pandas之Series

pandas之Series一维数据，带标签的数组1. 创建Series1.1 通过list 创建Series需要指定 data，index，data和index是list类型或者 np.aranges1 = pd.Series(np.arange(10), index=list(string.ascii_uppercase[:10]))s2 = pd.Series([1, 2,...
复制链接

扫一扫