1.Pandas中有两个主要的数据结构:Series和DataFrame。
Series数据结构是一种类似于一堆数组的数据对象,由一组数据和行索引构成,DataFrame有行索引和列索引,而Series只有行索引,说明DataFrame是由Series构成的。
2.创建Series和DataFrame
import numpy as np
import pandas as pd
pd.Series(data=np.array[1,2,3],index=['a','b','c'])
data:表示传入的数据
index:表示索引,唯一与数据长度相等,默认会自动创建一个从0-N的整数索引
pd.DataFrame(data=np.random.randint(2,100,12).reshape(3,4),index=['a','b','c'],columns=['q','w','e','r'])
index:表示行标签,若不设置参数,则默认会自动创建一个从0-N的整数索引。
columns:列标签。
3.DataFrame 切片和索引
获取行数据有两种方式,需要借助loc属性或iloc属性。loc属性基于行索引名获取数据,用法为 data.loc['行索引'] ,如 data.loc['a'] 可以a行的数据。iloc属性基于数值索引获取数据,用法为 data.iloc[数值] ,如data.iloc[0]。
(1)添加一列t[1,2,3]