PHP读取doc,docx,xls,pdf,txt内容

我的一个客户有这样的需求:上传文件,可以是doc,docx,xls,pdf,txt格式,现需要用php读取这些文件的内容,然后计算文件里面字数.

1.PHP读取DOC格式的文件

      PHP没有自带读取word文件的类,或者是库,这里我们使用antiword(http://www.winfield.demon.nl/)这个包来读取doc文件.

     首先介绍一下如何在windows下使用:

      1.打开http://www.winfield.demon.nl/(antiword下载页面),找到对应的windows版本(http://www.winfield.demon.nl/#Windows),下载antiword windows版本(antiword-0_37-windows.zip);

      2.将下载下来的文件解压到C盘根目录下;

这里还有一点需要注意的:http://www.informatik.uni-frankfurt.de/~markus/antiword/00README.WIN这个连接里有windows下安装的说明文件.

  需要设置环境变量,我的电脑(右键)->高级->环境变量->在上面的用户变量里新建一个

  变量名:HOME

  变量值:c:\home这个目录应该是存在的,如果不存在就在C盘下创建一个home文件夹.

然后在系统变量,修改Path,在Path变量的值最前面加上%HOME%\antiword.

 

      3.开始->运行->CMD 进入到antiword目录;

      输入 antiword -h 看看效果.

 

   4.然后我们使用antiword –t 命令读取一下doc文件内容;首先复制一个doc文件到c:\antiword目录,然后执行

   >antiword –t 文件名.doc

   就可以看到屏幕上输出word文件的内容了.

可能你会问了,这和PHP读取word有什么关系呢?呵呵,别急,我们来看看如何在PHP里使用这个命令.

  <?php

  $file = “D:\xampp\htdocs\word_count\uploads\doc-english.doc”;

   $content = shell_exec(“c:\antiword\antiword –f $file”);

?>

这样就把word里面的内容读取content里面了.

至于如何在Linux下读取doc文件内容,就是下载linux版本的压缩包,里面有readme.txt文件,按照那种方式安装就可以了.

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值