最近在准备关于python操作excel系列的文章。在工作中每个人或多或少会接触一些大数据集。这对于本地excel大文件处理来说很有必要。
相关库、包
import xlrd
import os
import openpyxl
import numpy as np
# 导入xl-模板库
import xlutils
# 使用xlutils要将文件保存为xls文件,高版本的xlsx文件兼容性较差
# 导入模板复制库
from xlutils.copy import copy
import xlwt
import time
import pandas as pd
# pip install xlsxwriter -i https://pypi.tuna.tsinghua.edu.cn/simple/
import pandas.io.formats.excel
pandas.io.formats.excel.header_style = None
from openpyxl import load_workbook
from openpyxl.styles import colors, Font, Fill, NamedStyle
from openpyxl.styles import PatternFill, Border, Side, Alignment
加载数据集:
data = xlrd.open_workbook('7a.xlsx')
# 找到第几个sheet页面
data1 = data.sheet_by_index(0)
# 读取行列内容
print(data1.cell_value(0,1))
print(data1.cell(0,0).value)
print(data1.row(0)[0].value)
新建数据集
# 新建excel文件
new_workbook = xlwt.Workbook()
# 添加工作表
worksheet = new_workbook.add_sheet('new_test')
# 指定单元格写入(行,