Dataframe构造函数
常用的函数构造参数有如下所示
data:ndarrary,interable,dataframe,dict,series,list类型数据
index:行号索引
columns:列号索引
import numpy as np
import pandas as pd
#创建一个Dataframe
data=pd.DataFrame(np.arange(16).reshape(4,4),index=list('abcd'),columns=list('ABCD'), dtype=float)
print(data)
A B C D
a 0.0 1.0 2.0 3.0
b 4.0 5.0 6.0 7.0
c 8.0 9.0 10.0 11.0
d 12.0 13.0 14.0 15.0
iloc函数
iloc常用于获取数据,一般是通过列号去获取数据
获取整列数据,或者是符合要求的数据,具体如下展示
data.iloc[:,1:] # 从第二列开始获取数据 第1个图所示
data.iloc[:,-1] # 获取最后一行的数据,:表示获取所有的值,','逗号表示维度分隔 第2个图
loc函数
一般通过idnex,columns索引去查找数据,具体例子如图所示
data.loc[:,'A'] # 获取A列的数据 # 第1个图
data.loc['a','A'] # 获取a行b列的数据 第2个图
data.loc[['a', 'b'], ['A', 'B']] # 获取a,b行和A,B行交叉的数值 第3个图
pandas转化ndarray
values方法(等同于无参数的as_matrix()函数,但是as_matrix这个参数已经被pandas官方抛弃)
print("data's type:", type(data))
data = data.values
print("data's type:", type(data))
data's type: <class 'pandas.core.frame.DataFrame'>
data's type: <class 'numpy.ndarray'>