读取Excel
1、read_excel()方法中参数说明:
io:excel文件
sheet_name:返回指定sheet,默认索引0返回第一个,也可用名称,如果返回多个则可用列表,为None则返回全表
header:指定表头,也可用列表指定多行
names:自定义列名,长度和Excel列长度必须一致
index_col:用作索引的列
usecols:读取指定的列,参数为列表,如[0, 1]表示第1和第2列
2、实例
读取Excel
# 方法一:通过 index 指定工作表
df3 = pd.read_excel(file_name, sheet_name=0)
# 方法二:指定工作表名称
df4 = pd.read_excel(file_name, sheet_name='Sheet1')
导入制定列
df6 = pd.read_excel(r'D:/source.xlsx', usecols='A:D,H')
# 或者
df6 = pd.read_excel(r'D:/source.xlsx', usecols=[0,1,2,3,7])
指定表头
df = pd.read_excel(file_name, header=1)
操作表格
data= pd.read_excel(file_name)
#查看所有的值
print(data.values)
#查看第一行的值
print(data.values[0])
#查看某一列所有的值
print(data['标题列1'].values)
#新增列
data['标题列3'] = None
#新增行
data.loc[3] = ['王五', 100, '男']
#删除行:axis=0
data = data.drop([0,1], axis=0)
#删除列:axis=1
data.drop('标题列3', axis=1)
写入Excel
1、to_excel()方法参数详解
excel_writer : 字符串或ExcelWriter 对象,文件路径或现有的ExcelWriter
sheet_name :字符串,默认“Sheet1”,将包含DataFrame的表的名称。
na_rep : 字符串,默认‘ ’,缺失数据表示方式
float_format : 字符串,默认None,格式化浮点数的字符串
columns : 序列,可选,要编写的列
header : 布尔或字符串列表,默认为Ture。写出列名。如果给定字符串列表,则假定它是列名称的别名。
index :布尔,默认的Ture,写行名(索引)
index_label : 字符串或序列,默认为None。如果需要,可以使用索引列的列标签。如果没有给出,标题和索引为true,则使用索引名称。如果数据文件使用多索引,则需使用序列。
startrow :左上角的单元格行来转储数据框
startcol :左上角的单元格列转储数据帧
engine : 字符串,默认没有,使用写引擎 - 您也可以通过选项io.excel.xlsx.writer,io.excel.xls.writer和io.excel.xlsm.writer进行设置。
merge_cells : 布尔,默认为Ture,编码生成的excel文件。 只有xlwt需要,其他编写者本地支持unicode。
inf_rep : 字符串,默认“正”,无穷大的表示(在Excel中不存在无穷大的本地表示)
freeze_panes : 整数的元组(长度2),默认为None。指定要冻结的基于1的最底部行和最右边的列
2、实例
数据格式转换成pandas格式
data = pd.DataFrame(table_list)
无索引
df.to_excel(output_file, index=False)
写入多工作表
with pd.ExcelWriter(output_file, engine='xlsxwriter') as writer:
df1.to_excel(writer, sheet_name='Sheet1', index=False)
df2.to_excel(writer, sheet_name='Sheet2', index=False)