"""
Pandas常用的两个工具数据结构:
1.Series
2.DataFrame
Series:
Series是一种一维的数组型对象,包含了一个值序列(与Numpy中的类型相似),并且包含了数据标签,称为索引(index)
交互式环境中,Series的字符串表示,索引在左边,值在右边。
如果不人为的给数据指定索引,默认生成的索引是从0~N-1(N为数据的长度)
Series的属性:
1.values:获取Series对象的值
2.index:获取Series对象的索引
如果人为的设置了索引(通常情况下,也是需要设置的),那么选择数据的时候可以使用标签来进行索引
"""
import pandas as pd
series_1 = pd.Series([1, 2, 3, 4])
print(series_1)
print(series_1.iloc[0])
series_2 = pd.Series([99, 98, 97, 100], index=["XiaoMIng", "XiaoHong", "XiaoGang", "XiaoLiang"])
print(series_2)
print(series_2[series_2 > 98])
print(series_2["XiaoHong"])
print(series_2[["XiaoHong", "XiaoLiang"]])
# 从另一个角度考虑Series,可以认为是一个长度固定且有序的字典,因为它将索引值和数据值按位置配对。
# 因此,在使用字典的上下文中,也可以使用Series
"""
把字典传递给Series构造函数时,产生的Series的索引将是排序好的字典键名
同时,也可以将字典键按照想要的顺序传递给构造函数,从而生成的Series的索引顺序符合预期
"""
player = {"Faker": 1001, "Uzi": 1002, "Khan": 1003, "Ming": 1004, "MLXG": 1005}
series_3 = pd.Series(player)
print(series_3)
series_4 = pd.Series(player, index=["Uzi", "Ming", "MLXG", "Faker", "Khan", "XiaoHu"])
print(series_4) # 因为没有对应的XiaoHu的数据,所以对应的值为NaN,这是pandas中标记缺失值或NA值的方式
"""
pandas使用pd.isnull()和pd.notnull()函数来检查缺失数据
"""
print(pd.isnull(series_4))
print(pd.notnull(series_4))
"""
Series对象自身和其索引都有name属性
索引可以通过按位置赋值的方式进行改变
"""
series_4.index.name = "player_name"
print(series_4)
series_5 = pd.Series([1, 2, 3, 4])
series_5.index = ["One", "Two", "Three", "Four"]
print(series_5)
二、Pandas-1.pandas数据结构-Series
最新推荐文章于 2023-03-22 15:39:05 发布