PHP读取word文档里的文字及图片,并保存
一、composer安装phpWord
composer require phpoffice/phpword
二、phpWord 读取 docx 文档(注意是docx格式,doc格式不行)
如果你的文件是doc格式,直接另存为一个docx就行了;如果你的doc文档较多,可以下一个批量转换工具:http://www.batchwork.com/en/doc2doc/download.htm
如果你还没配置自动加载,则先配置一下:
require ‘./vendor/autoload.php‘;
加载文档:
$dir = str_replace(‘\\‘, ‘/‘, __DIR__) . ‘/‘;$source = $dir . ‘test.docx‘;$phpWord = \PhpOffice\PhpWord\IOFactory::load($source);
三、关键点
1)对齐方式:PhpOffice\PhpWord\Style\Paragraph -> getAlignment()
2)字体名称:\PhpOffice\PhpWord\Style\Font -> getName()
3)字体大小:\PhpOffice\PhpWord\Style\Font -> getSize()
4)是否加粗:\PhpOffice\PhpWord\Style\Font -> isBold()
5)读取图片:\PhpOffice\PhpWord\Element\Image -> getImageStringData()
6)ba64格式图片数据保存为图片&#