最近在做需求的时候,需要将excel的xlsx文件转为html。
试着找了网上的好多方法,大部分都是table转excel,很少excel转为table标签。
如果用pandas库的to_html方法,并不能对合并单元格做有效的处理
目前会读取单元格行高,列宽,字体大小,是否加粗,合并单元格等
如果需要不是你们的需要生成的格式,大家可以在里面加样式就可以
1.读取excel 并 定义相关变量
import re
from openpyxl import load_workbook
from openpyxl.cell import MergedCell
file=r'你的excel文件路径'
wb=load_workbook(filename=file)
sheet=wb[wb.sheetnames['用于转换的sheet索引页']]
cell_dic= {} #用于储存 所有合并单元格的左上单元格对象
col_width={} #用于储存 所有列的列宽,px
row_height={} #用于储存 所有列的行高,px
2.查询所有列的列宽
#查询列宽
for col in sheet.columns:
pat=r"[A-Z]+"
pat=re.compile(pat)
colname=pat.findall(col[0].coordinate)[0] #分离字母 和数字,取出列字母名称
px=round(sheet.column_dimensions[colname].width*5) #读出列宽换算为像素
col_width[colname]=px
3.查询所有行的行高
#查询行高
for row in sheet.rows:
pat=r"[A-Z]+(\d+)"
pat=re.compile(pat)
rowid=int(pat.findall(row[0].coordinate)[0]) #分离字母 和数字,取出行数字序号
px=sheet.row_dimensions[rowid].height #读出行高换算为像素
if px == None:
px=13.5
row_height[str(rowid)]=px
4.遍历合并的单元区域,找到左上位置的单元格储存在cell_dic字典中,注释很详细
# 找出所有合并区域的行高,列宽,向右合并距离,向下合并距离
for merged_range in sheet.merged_cells.ranges:
now_width=0 #定义列宽
now_height=0 #定义行高
for i in range(merged_range.min_col,merged_range.max_col+1):
coord = sheet.cell(row=1, column=i).coordinate #位置标识,例如:A1
pat = r"[A-Z]+"
pat = re.compile(pat)
colname = pat.findall(coord)[0] # 分离字母 和数字,取出列字母名称
now_width=now_width+col_width[colname]
for i in range(merged_range.min_row, merged_range.max_row + 1):
coord = sheet.cell(row=i, column=1).coordinate # 位置标识,例如:A1
pat = r"[A-Z]+(\d+)"
pat = re.compile(pat)
colindex = pat.findall(coord)[0] # 分离字母 和数字,取出列数字名称
now_height=now_height+row_height[colindex]
now_width=int(now_width) #合并单元格列宽(所有子单元格相加)
now_height=int(now_height) #合并单元格行高(所有子单元格相加)
cell = sheet.cell(row=merged_range.min_row, column=merged_range.min_col) # 选择合并区域左上单元格
colspan = merged_range.max_col - merged_range.min_col + 1 #向右合并长度
rowspan = merged_range.max_row - merged_range.min_row + 1 #向下合并长度
cell_dic[cell]=(now_height,now_width,colspan,rowspan)
5. 这里先定义一个table标签头,不懂的可以去学下html 的table标签
html='''<table border="1">'''
6.这块主要就是拼接html了
#开始写入数据到table标签
for row in sheet.rows:
tr='''<tr>'''
for cell in row:
td=""
if cell in cell_dic: #判断是否为合并单元格左上单元格
if cell.value == None:
text=''
else:
text=cell.value
if cell.alignment.vertical != None:
vertical =f'''vertical-align: {cell.alignment.vertical};''' # 水平位置
else:
vertical = ''
if cell.alignment.horizontal != None:
horizontal = f'''text-align: {cell.alignment.horizontal};''' # 垂直位置
else:
horizontal = ''
font_size=str(int(cell.font.size)+3) #字体大小
font_weight='700' if cell.font.b else '400' #字体是否加粗
style=f'''"color: rgb(0, 0, 0); font-size: {font_size}px; font-weight: {font_weight}; font-style: normal;{vertical}{horizontal}"'''
td = f'''<td height="{cell_dic[cell][0]}" width="{cell_dic[cell][1]}" colspan="{cell_dic[cell][2]}" rowspan="{cell_dic[cell][3]}" style={style}>{text}</td>'''
else:
if not isinstance(cell, MergedCell): # 判断该单元格是否为合并单元格
if cell.alignment.vertical != None:
vertical = f'''vertical-align: {cell.alignment.vertical};''' # 水平位置
else:
vertical = ''
if cell.alignment.horizontal != None:
horizontal = f'''text-align: {cell.alignment.horizontal};''' # 垂直位置
else:
horizontal = ''
pat = r"([A-Z]+)(\d+)"
pat = re.compile(pat)
cell_name=pat.findall(cell.coordinate)[0][0]
cell_index = pat.findall(cell.coordinate)[0][1]
font_size=str(int(cell.font.size)+3) #字体大小
font_weight = '700' if cell.font.b else '400' # 字体是否加粗
style = f'''"color: rgb(0, 0, 0); font-size: {font_size}px; font-weight: {font_weight}; font-style: normal;{vertical}{horizontal}"'''
if cell.value != None:
td = f'''<td height="{row_height[cell_index]}" width="{col_width[cell_name]}" style={style} >{cell.value}</td>'''
else:
td = f'''<td height="{row_height[cell_index]}" width="{col_width[cell_name]}"></td>'''
tr=tr+td
tr=tr+'''</tr>'''
html=html+tr
7.再加一个table标签尾巴,写入本地 end
html=html+'''</table>'''
#写入本地
with open(r"写入路径",'w',encoding='utf-8') as f:
f.write(html)
贴出全部代码
import re
from openpyxl import load_workbook
from openpyxl.cell import MergedCell
class to_html():
def __init__(self,file,save_file,sheet_name):
self.file=file #文件路径
self.save_file=save_file #html保存路径
self.sheet_name=sheet_name #sheet名
def creat_html(self):
wb=load_workbook(filename=self.file)
sheet=wb[self.sheet_name]
cell_dic= {} #用于储存 所有合并单元格的左上单元格对象
col_width={} #用于储存 所有列的列宽,px
row_height={} #用于储存 所有列的行高,px
#查询列宽
for col in sheet.columns:
pat=r"[A-Z]+"
pat=re.compile(pat)
colname=pat.findall(col[0].coordinate)[0] #分离字母 和数字,取出列字母名称
px=round(sheet.column_dimensions[colname].width*5) #读出列宽换算为像素
col_width[colname]=px
#查询行高
for row in sheet.rows:
pat=r"[A-Z]+(\d+)"
pat=re.compile(pat)
rowid=int(pat.findall(row[0].coordinate)[0]) #分离字母 和数字,取出行数字序号
px=sheet.row_dimensions[rowid].height #读出行高换算为像素
if px == None:
px=13.5
row_height[str(rowid)]=px
# 找出所有合并区域的行高,列宽,向右合并距离,向下合并距离
for merged_range in sheet.merged_cells.ranges:
now_width=0 #定义列宽
now_height=0 #定义行高
for i in range(merged_range.min_col,merged_range.max_col+1):
coord = sheet.cell(row=1, column=i).coordinate #位置标识,例如:A1
pat = r"[A-Z]+"
pat = re.compile(pat)
colname = pat.findall(coord)[0] # 分离字母 和数字,取出列字母名称
now_width=now_width+col_width[colname]
for i in range(merged_range.min_row, merged_range.max_row + 1):
coord = sheet.cell(row=i, column=1).coordinate # 位置标识,例如:A1
pat = r"[A-Z]+(\d+)"
pat = re.compile(pat)
colindex = pat.findall(coord)[0] # 分离字母 和数字,取出列数字名称
now_height=now_height+row_height[colindex]
now_width=int(now_width) #合并单元格列宽(所有子单元格相加)
now_height=int(now_height) #合并单元格行高(所有子单元格相加)
cell = sheet.cell(row=merged_range.min_row, column=merged_range.min_col) # 选择合并区域左上单元格
colspan = merged_range.max_col - merged_range.min_col + 1 #向右合并长度
rowspan = merged_range.max_row - merged_range.min_row + 1 #向下合并长度
cell_dic[cell]=(now_height,now_width,colspan,rowspan)
html='''<table border="1">'''
#开始写入数据到table标签
for row in sheet.rows:
tr='''<tr>'''
for cell in row:
td=""
if cell in cell_dic: #判断是否为合并单元格左上单元格
if cell.value == None:
text=''
else:
text=cell.value
if cell.alignment.vertical != None:
vertical =f'''vertical-align: {cell.alignment.vertical};''' # 水平位置
else:
vertical = ''
if cell.alignment.horizontal != None:
horizontal = f'''text-align: {cell.alignment.horizontal};''' # 垂直位置
else:
horizontal = ''
font_size=str(int(cell.font.size)+3) #字体大小
font_weight='700' if cell.font.b else '400' #字体是否加粗
style=f'''"color: rgb(0, 0, 0); font-size: {font_size}px; font-weight: {font_weight}; font-style: normal;{vertical}{horizontal}"'''
td = f'''<td height="{cell_dic[cell][0]}" width="{cell_dic[cell][1]}" colspan="{cell_dic[cell][2]}" rowspan="{cell_dic[cell][3]}" style={style}>{text}</td>'''
else:
if not isinstance(cell, MergedCell): # 判断该单元格是否为合并单元格
if cell.alignment.vertical != None:
vertical = f'''vertical-align: {cell.alignment.vertical};''' # 水平位置
else:
vertical = ''
if cell.alignment.horizontal != None:
horizontal = f'''text-align: {cell.alignment.horizontal};''' # 垂直位置
else:
horizontal = ''
pat = r"([A-Z]+)(\d+)"
pat = re.compile(pat)
cell_name=pat.findall(cell.coordinate)[0][0]
cell_index = pat.findall(cell.coordinate)[0][1]
font_size=str(int(cell.font.size)+3) #字体大小
font_weight = '700' if cell.font.b else '400' # 字体是否加粗
style = f'''"color: rgb(0, 0, 0); font-size: {font_size}px; font-weight: {font_weight}; font-style: normal;{vertical}{horizontal}"'''
if cell.value != None:
td = f'''<td height="{row_height[cell_index]}" width="{col_width[cell_name]}" style={style} >{cell.value}</td>'''
else:
td = f'''<td height="{row_height[cell_index]}" width="{col_width[cell_name]}"></td>'''
tr=tr+td
tr=tr+'''</tr>'''
html=html+tr
html=html+'''</table>'''
with open(self.save_file,'w',encoding='utf-8') as f:
f.write(html)
if __name__=='__main__':
data=to_html("D:\\test.xlsx","D:\\test.html","测试sheet")
data.creat_html()
测试图
生成的html源代码
<table border="1"> <tr> <td height="13" width="195" colspan="3" rowspan="1" style="color: rgb(0, 0, 0); font-size: 14px; font-weight: 400; font-style: normal;vertical-align: center;text-align: center;">合并单元格</td> </tr> <tr> <td height="18.75" width="65" style="color: rgb(0, 0, 0); font-size: 14px; font-weight: 700; font-style: normal;vertical-align: center;">加粗</td> <td height="18.75" width="65" style="color: rgb(0, 0, 0); font-size: 17px; font-weight: 400; font-style: normal;vertical-align: center;">宋体</td> <td height="18.75" width="65"> </td> </tr> <tr> <td height="27" width="130" colspan="2" rowspan="2" style="color: rgb(0, 0, 0); font-size: 21px; font-weight: 400; font-style: normal;vertical-align: center;text-align: center;">合并单元格</td> <td height="13.5" width="65" style="color: rgb(0, 0, 0); font-size: 14px; font-weight: 400; font-style: normal;vertical-align: center;text-align: center;">居中</td> </tr> <tr> <td height="13.5" width="65" style="color: rgb(0, 0, 0); font-size: 14px; font-weight: 400; font-style: normal;vertical-align: center;text-align: right;">靠右</td> </tr> </table>