php对pdf内容的解析目前有一个很好用的开源项目
传送门:http://www.pdfparser.org/
php对word中内容的解析则可以调用com组件实现(仅适用windows平台,且在装有word的情况下。。。)
代码如下:
// 建立一个指向新COM组件的索引
$word = new COM("word.application") or die("Can't start Word!");
$filename = 'E:/wamp/www/pdfword2txt/test.doc';
$word->Documents->OPen($filename);
//读取文档内容
$test= $word->ActiveDocument->content->Text;
echo $test;
flush();
$word->Quit();
?>如果大家还发现更好的解析方法的话,欢迎交流学习~~
转载请注明出处:http://blog.csdn.net/iluckyning/article/details/22591853