两种:一维数组型的Series对象+二维表格型的DataFrame对象
andas的索引对象index是不可变的,因此用户不能对其进行修改。
但index中可以包含重复的标签。选择重复的标签,会显示所有的结果。
目录
一、Series对象
只能存储同一数据类型的数据 结构:index+values
a.values() #查看
a.index()
a.shape #Series对象的形状
a.name='grade' #name属性为对象&索引命名
a.index.name='科目'
a[1] #查看 切片
a[0:2]
a[['a','b','c']]
a[a>=90] #筛选
a.isnull() #isnull()检测是否为空值
1、Series对象创建(4种)
(1)Numpy的一维ndarray数组
import pandas as pd
import numpy as np
a=pd.Series(np.arange(0,5,2),index=['a','b','c'])
a
(2)标量值创建
b=pd.Series(25,index=['a','b','c'])
b
(3)字典创建
dict1={'a':1,'b':2,'c':3}
a=pd.Series(dict1)
a
(4)列表创建
b=pd.Series(data=[4,7,-5,3],index=['d','a','b','c'])
b
2、Series对象的基本运算
a=pd.Series(data=[90,86,95],index=['java','c','python'])
a+2 #整个a的值都加2
np.sqrt(a) #a的值的平方根
np.exp(a) #e的x幂次方根
a.count() #计数
a.drop(index=['java','c'])
#Series间的计算
a=pd.Series([1,2,3],index=['a','b','c'])
b=pd.Series([2,4],index=['b','c'])
a+b
#在将数据相加时,若存在不同的索引对,则结果的索引就是该索引对的并集。
a NaN b 4.0 c 7.0 dtype: float64
3、基本功能
# 重新索引
a=pd.Series([4,6,3,5],index=['c','d','a','e'])
a1=obj.reindex(['a','b','c','d','e'])
a1
#reindex将会根据新索引进行重排,若某个索引值当前不存在,就引入缺失值。
a 3.0 b NaN c 4.0 d 6.0 e 5.0 dtype: float64
二、DataFrame对象
一个表格型的数据结构,含有一组有序的列。 既有行索引也有列索引。
每列可以是不同的值类型(数值、字符串、布尔值等)