我正在尝试使用包含非拉丁字符的ITextRenderer生成pdf文档。在我这里是保加利亚语。
在调用ITextRenderer之前,我有一个字符串内容,在一些进程(比如使用整理解析)看起来像那样(我可以通过调试看到这个值)
刺痛的内容:
td class="description">Вид на потока
td class="description">Статус на потока以上只是我的字符串的一部分。此内容包含有效的html语法。我只是在这里放一小部分来澄清,直到这部分,我的编码是正确的,因为我能够读取保加利亚字符。
之后,下面的代码会创建一个文档,将其放入itextrenderer并生成pdf文件。这段代码已经过测试,并且可以处理相关字符的内容,因为我能够成功生成英语语言的pdf文件。
当我用非拉丁字符切换另一种语言(保加利亚语)时出现问题。生成的PDF将忽略所有保加利亚字符,最终结果是带有大量空行的pdf。这是生成pdf的代码的一部分
DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();
dbf.setValidating(false);
dbf.setNamespaceAware(false);
dbf.setFeature("http://xml.org/sax/features/namespaces", false);
dbf.setFeature("http://xml.org/sax/features/validation", false);
dbf.setFeature("http://apache.org/xml/f