去除html table里面多余的内容
需求概述
工作中,客户会发来excel表格,让放到网站上进行显示。将表格粘贴到在线版的html编辑器 在线编辑html链接 生成代码后,代码里会有很多冗余的代码,为了与系统原来样式保持一致,必须去掉这些多余的代码
去除操作
采用带有正则匹配的工具,如vscode,webstorm等
第一步去除 class height width style
附上正则:
(class="[\s\S]*?")|(height="[\s\S]*?")|(width="[\s\S]*?")|(style="[\s\S]*?")
从上图可以看出,我们需要替换的内容已经被全部匹配上,点击全部替换即可
第二步去除多余的空格
[\s]+?>
点击全部替换后的结果
其他
去掉头尾的
<p>|</p>