最近在处理网站批量导出模版word时,遇到一个问题:
网站是用PHP语言编写的,导出模版word(即将用户填写内容动态的插入word相应位置,生成.doc或.docx文件)采用的是PHPWord插件,但是发现部分word文件无法打开,提示 “xml pasring error 行2 列25343”。
解决的过程:
1、设法查看到导出的这份word文件(假设为tmp.docx)的xml部分:将.docx后缀名改为.zip后解压,进入word文件夹,打开document.xml后查看相应的 行2 列25343,查看前后内容
2、发现附近的内容出现了“颗粒物直径<10mm”字样,这时候敏感的感觉是 ” < ” 符号出现了错误。
3、查阅相关的xml转义字符,发现在xml文件中 “&”、“<”、“>”、单引号、双引号会引起xml文件编译错误,特别是“&”和“<”是“坚决”不能在xml文件中出现的。
4、在调用PHPWord插件的相关插入函数setValue时,先将插入内容进行标准化:
>(大于):>
"(双引号):"
'(单引号):'
&(逻辑与):&
<(小于):<
注意末尾的分号 ;
5、完美解决。PS.另外一种解决方式是修改PHPWord的插件代码,在public function setValue($search, $replace)