当excel文件里面含有多个表时,用pandas导入会出现生成的dateframe表不一样。
- 错误
import pandas as pd
df=pd.read_xlsx('文件名.xlsx')
整体代码
pd.read_excel(path, sheet_name=0, header=0, names=None, index_col=None,
usecols=None, squeeze=False,dtype=None, engine=None,
converters=None, true_values=None, false_values=None,
skiprows=None, nrows=None, na_values=None, parse_dates=False,
date_parser=None, thousands=None, comment=None, skipfooter=0,
convert_float=True, **kwds)
- sheet_name --> 读取 工作表(sheet)名称
- sheet_name:None代表读取所有的sheet;
#sheet_name=1代表取出第2个表
df=pd.read_excel(path,sheet_name=1)
- header --> 指定前几行作为列名(指定数据表的表头,默认值为0)
- names --> 自定义列名(但是names的长度必须和Excel列长度必须一致)
df=pd.read_excel(path,sheet_name=1,
names=['a','b','c'])
- usecols --> 读取指定的列
#usecols可避免读取所有数据
df=pd.read_excel(path,sheet_name=1,
usecols=[0,1,2] #读取第1,2,3列数据