pandas主要用于大数据分析,是一个高效的数据处理库
官方文档:http://pandas.pydata.org/pandas-docs/stable/overview.html
pandas安装
- pandas依赖处理Excel的xlrd模块,所以我们需要先安装xlrd
- 安装pandas模块还需要一定的编码环境,所以我们自己在安装的时候,确保你的电脑有这些环境:Net.4 、VC-Compiler以及winsdk_web
- 然后就可以安装pandas了
简单用法
df = pandas.read_excel("test_data/testCase.xlsx",sheet_name="testCaseRead")
data1 = df.head() # 获取每行数据,默认前5行返回结果是类似表格形式的数据
print(df.index.values) # 获取行号并打印输出
print(df.columns.values) # 获取所有列名并打印输出
print(df.sample(3).values) # 打印指定行数的值
print(df["id"].values) # 打印指定列的值
data2 = df.loc[[0,1,2],].values # 读取某一行的数据,注意2个中括号
data3 = df.loc[[0,1,2],["id","module"]].values # 读取某几行ID和module这2列的数据
data4 = df.loc[:,["id","module"]].values # 读取所有行的id、module列的数据
data5 = df.loc[:,:] # 读取所有行所有列的数据
print(data1,data2,data3,datqa4,data5,end="\n")
df.head() 返回的结果如图
其他操作返回的均为列表