1)DataFrame的创建
DataFrame既有行索引 index,也有列索引 column,值:Value,是表格型的数据结构
from Pandas import DataFrame
数组 df=DataFrame(data=[[1,2,4],[2,3,4]])
numpy df=DataFrame(data=numpy.random.randint(0,100),size=(6,4)))
字典 dic={"name":['zhangsan','lisi','wangwu'],"salary":[1000,2000,300]}
df=DataFrame(data=dic,index=['a','b','c']) 字典当中的key做了列索引,index指定了行索引
2)常用属性 .index .columns .values .shape
.dtype会报错。DataFrame是表格型数组,所以可以存储多种数据类型
3)索引和切片:
3.1索引
如果有显示索引,通过索引机制取行和列的时候,只能用显示索引,即直接要用索引名
df['name']:取单列
df['name','salary']: 取多列
df.iloc[0]:取单行
df.iloc[[0,3,5]]:取多行
iloc:表示通过隐式索引取行 loc:表示通过显示索引取行,若果原始数据有显示索引,要用loc
df.iloc[0,2] :取单个元素,其中0表示行,2表示列
df.loc[显示索引,显示索引] :取单个元素,其中0表示行,2表示列
df.iloc[[1,3,5],2]:取多个元素 第1,3,5行中第2列的值
3.2切片
df[0:2] 切行,与索引正好相反
df.iloc[:,0:2] 切列 ,iloc切隐式索引
如果series和datafram设置了显示索引,隐式索引也是存在的。