pandas库read_csv方法使用及索引
数据来源关注公众号FF工作室,后台回复pandas读取文件
- pd.read_csv(filename,seq=””,na_values=””,names=[],header=,nrows=,skip_footer=[x1,x2,……]……)与read_table()参数一样,只不过read_csv默认seq=”,”用逗号进行分隔,table的seq默认为\n
可自定义改变seq值
常用参数:
a) names : 代表列名
b) header : 数据从哪一行开始读,默认为None从0行开始读并且返回列,行(0,1,2,3,……长度x)作为列行名,若为其他数字如2,则将序号为2的行作为列名读取数据
c) nrows : 读几行
d) skip_footer : 列表中的x1……代表忽略这几行不读
import pandas as pd
x = pd.read_csv("班级名单1.csv",header=0,sep=",",na_values='?')
print(x)
结果为如图一
该文件记事本打开为如图二
更改sep = “\n”输出结果为图三
更改header为header = None 结果为图四 改为header = 2结果为图五
2. print(x[‘列名y’]) : x为read_csv和table读文件出来返回的变量,该方式可以输出x中列名为y的数据
- x.loc[0] : x为read_csv和table读文件出来返回的变量,该方式可以返回x的第0行数据,同时也可以利用第二个列名进行索引定位某一行具体列的数据,[]也满足python切片操作
import pandas as pd
x = pd.read_csv("班级名单 1.csv",header=0,sep=",",na_values='?')
print(x)
print("x[姓名]\n",x["姓名"])
print("x.loc[2]\n",x.loc[2])
print("x.loc[2][分组]\n",x.loc[2]["分组"])
结果为图六