java pdfbox0.8 UniGB-UCS2-H 问题

这篇博客探讨了在Java中使用PDFBox库遇到的UniGB-UCS2-H编码问题,详细记录了解决方案和过程,适合对PDF处理和字符编码有研究的读者。
摘要由CSDN通过智能技术生成

http://drunkfish.spaces.live.com/blog/cns!FC3E3585A287F598!372.entry
看源码发现有一个包org.apache.pdfbox.encoding.conversion, 这里已经有了各自中文编码的解析程序. 可奇怪的是却没有任何地方调用这些程序. 所以解析pdf文档是依然会报IOException说UniGB-UCS2-H等字体找不到. 看来只有修改源码来解决了. 仔细研究代码后, 发现修改点是程序org.apache.pdfbox.pdmodel.font.PDFont.java
 
首先增加一个方法以得到字体信息
    public String getEncodingName() {
        COSBase encoding
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值