读取3种表格类型数据:
1、纯文本文件(逗号或Tab分隔):csv, tsv, txt pd.read_csv
2、excel文件:xls xlsv pd.read_excel
3、mysql pd.read_sql
data = pd.read_csv(f_path)
读取头几行:data.head()
形状(行列):data.shape
查看列名列表:data.columns
查看索引列:data.index
数据类型:data.dtypes
示例:data = pd.read_csv(fpath,sept='\t',header=None,names=['pdata','p','v'])
二、数据结构
DataFrame 和 Series
DataFrame代表整个表格对象,二维数据,多行多列;
其中index查行,columns查列
可以根据多个字典序列创建:
data = {'name':['zhou','chui'], 'year':[1999,2000]}
df = pd.DataFrame(data)
Series:一维数据,一行或一列;有点类似字典;
查询一行或一列返回的是Series,查询多行多列返回的是DataFrame
三、查询数据
df.loc方法(既能查又能写):标签值查询;行:df.loc[1] 查询多行:df.loc[1:3] 包含末尾元素
df.iloc方法:数字位置查询
查询列:df['name']
df.set_index('x') 设定索引