索引
‘’’
这种双重抽象虽然看起来没必要,但是pandas索引的数据类型,
可以支持字符串、日期、任意排序的索引,以及重复的索引值。
索引是pandas的核心功能,在序列上的操作,可以按照索引进行查找。特别是时间序列的数据集对象。
cool = {
' index ':[ 'Alan' , 'Irina' , 'Lisa' , 'Mark'] ,
' data ':[180 , 162 , 165 , 173] ,
' name ': 'family'
}
print(cool)
结果:
序列
# pandas 序列
import pandas as pd
'''
该系列是一维的。 但是,这看起来像是二维的。
最左边的列是索引,其中包含索引的条目。
'''
cool2 = pd.Series ([180, 162, 165, 173] ,
name = 'family')
'''
索引的通用名称是轴(axis),索引的值(0、1、2、3)称为轴标签(axis labels),
因此它们是整数。
Series 的值可以包含字符串、浮点数、布尔值或任意 Python 对象。
'''
print(cool2)
'''
检查序列(或者数据框)的索引很容易,因为它是对象的属性(索引是序列的一部分)。
'''
print(cool2.index)
基于字符串的索引
'''
索引也可以是基于字符串的,在这种情况下,pandas所表示的索引是对象,不是字符串。
'''
import pandas as pd
cool3 = pd.Series ([180, 162, 165, 173] ,
name = 'family' ,
index =[ 'Alan' , 'Irin' , 'Lisa' , 'Mark'])
'''
我们打印 Series时看到的 dtype是值的类型,而不是索引的数据类型。
'''
print(cool3)
'''
如果检查index属性,就会知道数据类型(dtype)是对象(object)了。
'''
print(cool3.index)
序列的元素可以不同质
import pandas as pd
# 建立一个对象Smart
class Smart :
pass
# 建立一个包括foo的序列rings
hot = pd.Series(
['Eric' , 'Karl' , 73 , Smart()] ,
name = 'rings')
'''
序列之内的实际数据(数值)不必是数字或同质的。
我们把Smart这个对象插入到rings这个系列。
'''