这几天帮朋友解决一个技术问题,在linux下,将word文档中的内容读取,然后使用正则匹配,拼成sql入库
查阅了外文资料和google之后,步骤如下:
#wget http://www.winfield.demon.nl/linux/antiword-0.37.tar.gz
#tar zxvf antiword-0.37.tar.gz
#cd antiword-0.37
#make
#make install
安装完成之后,如果要在web上查看的话,需要使用root执行 make global_install
<?php
header("Content-type: text/html; charset=utf-8");
$filename = 'test.doc';
#$content = shell_exec('antiword '.$filename);
$content = shell_exec('antiword -mUTF-8 '.$filename);
echo '<pre>';
print_r ($content);
echo '</pre>';