pandas操作excel
引入包
import numpy
import pandas
1、创建写入对象
writer = pandas.ExcelWriter(os.path.join(tar_path, file_name + '.xlsx'))
2、转化为dataframe对象
f = pandas.DataFrame(numpy.array(列表), columns=['指定列'])
3、读取excel对象
pandas.DataFrame(pandas.read_excel(src_path, sheet_name=sheetname, usecols=[0, 1, 2], keep_default_na=False, header=1))
- src_path:excel路径
- sheetname:excel的sheet页名称
- usecols:需要读取的列编号
- keep_default_na:空白单元格显示为空
- header:表头位置
- skip_rows:需要跳过的行数(从首行开始)
4、插入列到dataframe对象
table_frame.insert(loc=1, column='表中文名', value='表的中文名')
- loc:插位置列编号从0开始
- column:列名
- value:插入列的值
5、dataframe对象转换为list
l = numpy.array(dataframe).tolist()
6、获取某个单元格的值
table_data_frame.iloc[[2], [1]].values[0][0]
获取第三行,第二列的值
7、按照某列的值筛选数据内容
group = table_data_frame.loc[table_data_frame[5] == 'a']
筛选第五列为 ‘a’的数据内容
group = table_data_frame.loc[table_data_frame['name'] == 'a']
筛选 name 列为 ‘a’的数据内容
8、写入excel
f.to_excel(writer, index=False, sheet_name='指定sheet页')
9、关闭对象
writer.save()
writer.close()