PHP解析WORD中的公式
我这里用的是获取word文件中的XML信息,在XML中将公式转换为 MathML语言描述。
PHP: 7.3
扩展:zip
获取WORD中的XML信息
date_default_timezone_set('Asia/Shanghai');
$archive = new \ZipArchive();
$result = $archive->open($filename);
if ($result === true) {
$document = $archive->getFromName('word/document.xml');
} else {
//抛出异常 不能正确打开docx文件
}
$document
中就是获取的word的xml数据。
WORD公式在XML中是如何描述的
例如下面这个公式:
对应的word中的XML语言描述是:
<m:oMath>
<m:r>
<w:rPr>
<w:rFonts w:ascii="Cambria Math" w:hAnsi="Cambria Math"/>
<w:color w:val="262626" w:themeColor="text1" w:themeTint="D9"/>
<w:sz