使用python读取word文档的doc格式时,需要用到antiword这个软件。说一说这个软件在centos系统中的详细安装过程。
下载安装包
wget http://www.winfield.demon.nl/linux/antiword-0.37.tar.gz
解压安装包
tar -zxvf antiword-0.37.tar.gz -C ./
编译安装包
make -C antiword-0.37/
sudo make install -C antiword-0.37/
读取doc文档
antiword -mUTF-8 test.doc