In [7]:
import pandas as pd
filname = 'ch02数据导入\\student.xlsx'
data = pd.read_excel(filname)
data
# 打印前3行数据
data.head(3)
# 打印[1-3)行数据
data[1:3]
# 根据列名,打印某一列数据
data['姓名']
# 查看所有字段
field = data.columns.tolist()
field
# 只显示第四行
data.loc[4]
# 打印多个列数据,需要双层[[]]
data[["姓名", "年龄"]]
# 查看基础数据
# mean = 均值
# std = 方差
data.describe() # 只针对数值型
data2 = pd.read_excel(filname,header=None)
data2
data2.values
data.values
data.index
pandas参数说明
pandas.read_excel(io, sheet_name=0, header=0, skiprows=None, skip_footer=0, index_col=None, names=None, usecols=None, parse_dates=False, date_parser=None, na_values=None, thousands=None, convert_float=True, converters=None, dtype=None, true_values=None, false_values=None, engine=None, squeeze=False, **kwds)
1.io :excel 路径;
data3 = pd.read_excel(io=filname)
data3
2.sheetname:默认是sheetname为0,返回多表使用sheetname=[0,1],若sheetname=None是返回全表 。注意:int/string返回的是dataframe,而none和list返回的是dict of dataframe。
data3 = pd.read_excel(filname,sheet_name=[0,1])
data3
data3 = pd.read_excel(filname,sheet_name=0)
data3
data3 = pd.read_excel(filname,sheet_name=1)
data3
3.header :指定作为列名的行,默认0,即取第一行,数据为列名行以下的数据;若数据不含列名,则设定 header = None;
data3 = pd.read_excel(filname,sheet_name=0,header=None)
data3
data3 = pd.read_excel(filname,sheet_name=0,header=2)
data3
4.skiprows:省略指定行数的数据
data3 = pd.read_excel(filname, sheet_name=0, skiprows=1)
data3
5.skipfooter:省略从尾部数的行数据
data3 = pd.read_excel(filname, sheet_name=0, skipfooter=1)
data3
6.index_col :指定列为索引列,也可以使用 u’string’
data3 = pd.read_excel(filname, sheet_name=0, index_col=1)
data3
7.names:指定列的名字,传入一个list数据
data3 = pd.read_excel(filname, sheet_name=0,
names=['a', 'b', 'c', 'd', 'e'])
data3