java excel转pdf有乱码_word,ppt,txt,excel转换pdf 解决中文乱码

本文介绍了在Java环境下将Excel、Word、PPT、TXT转换为PDF时遇到的中文乱码问题及其解决办法。在Windows下使用OpenOffice作为转换引擎,并提供了Linux环境下处理编码差异的转换技巧。同时,提到了文件名包含中文时可能存在的转换问题,并给出了命令行使用jodconverter进行转换的示例。

摘要生成于 C知道 ,由 DeepSeek-R1 满血版支持, 前往体验 >

2.linux 下依赖的包太多,一直没安装成功。倒是windows下很容易,所以先弄个windows的,看看效果。

2)直接安装到C盘,安装目录C:\Program Files\OpenOffice.org 3

3)在命令符界面跳到上述目录C:\Program Files\OpenOffice.org 3\program,执行下列命令:

soffice -headless -accept="socket,host=127.0.0.1,port=8100;urp;" -nofirststartwizard

4) 下载jodconverter-tomcat:

5)解压后,在D:\jodconverter-tomcat-2.2.2\bin 目录中执行startup.bat

6)通过其他主机访问上述主机http://ip:8080,就可以执行装换了。

3.注意问题

1).txt文件有乱码现象,可以手工把文件扩展名改为odt,然后在转成pdf就ok了。

详情:http://nopainnogain.javaeye.com/blog/771036

如果是linux server,由于编码的不同(一般windows 是gb2312,linux是utf-8)所以需要进行编码转换

iconv -f gb2312 -t utf-8 test.txt -c -s -o test.odt(解释就是将gb2312的text.txt文件转换为test.odt文件输出,-c 忽略无效编码,-s关闭警告)

如果txt文件不是gb2312编码,可以用enca查看文件编码(下载地址:http://dl.cihar.com/enca/enca-1.13.tar.gz)命令:enca -i  text.txt 将查看到的编码格式替换掉gb2312再执行上述命令,便可以解决乱码。

2).不支持中文名称的ppt文件转换

3).不支持中文名称的word文件转换

4).excel中文名称有些文件可以转,有些不能转,还是建议都命名为英文的。

4.补充,直接下载jodconverter包可以在命令行实现转换

2)解压到D:\jodconverter-2.2.2

3)在OpenOffice的后台服务启动的前提下,直接从命令行跳到d:跟目录执行

java -jar jodconverter-2.2.2\lib\jodconverter-cli-2.2.2.jar d:\abc.doc  d:\abc.pdf   或者

java -jar jodconverter-2.2.2\lib\jodconverter-cli-2.2.2.jar -f pdf  d:\abc.txt(源文件) 新生成pdf文件与源文件保存在同一目录。

java -jar jodconverter-2.2.2\lib\jodconverter-cli-2.2.2.jar help 可以查看参数用法

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值