解决itextpdf下，html转pdf后，首字符为标点符号问题

最新推荐文章于 2024-05-08 10:14:46 发布

小兵不出门

最新推荐文章于 2024-05-08 10:14:46 发布

阅读量1.7k

点赞数 2

分类专栏：架构师学习之路文章标签： java

本文链接：https://blog.csdn.net/m0_37555654/article/details/107527669

版权

问题描述

通过富文本框取到的HTML转成PDF后，PDF出现行首存在标点符号的情况。（存在Html标签属性失效的问题。）
正常情况下，PDF文本内容，行首不能有标点符号
网上找了很多答案，但是局限于各种版本，发现使用起来都是各种报错，以下为测试通过的可用版本。

`itextpdf`版本

5.5.11

解决办法

写一个类继承`SplitCharacter`

package com.itextpdf.text;

import com.itextpdf.text.pdf.PdfChunk;
/**
 * <T>User：TODO</T>
 * <T>Description：中文字符编码</T>
 * <T>Create time：2020/7/23 3:41</T>
 * <T>Company: dolph</T>
 * <T>Update record(who,time,message):</T>
 */
public class ChineseSplitCharater implements SplitCharacter {
    /**
     * An instance of the default SplitCharacter.
     */
    public static final SplitCharacter DEFAULT = new ChineseSplitCharater();

    // line of text cannot start or end with this character
    static final char u2060 = '\u2060'; // - ZERO WIDTH NO BREAK SPACE

    // a line of text cannot start with any following characters in
    // NOT_BEGIN_CHARACTERS[]
    static final char u30fb = '\u30fb'; // ・ - KATAKANA MIDDLE DOT
    static final char u2022 = '\u2022'; // • - BLACK SMALL CIRCLE (BULLET)
    static final char uff65 = '\uff65'; // ･ - HALFWIDTH KATAKANA MIDDLE DOT
    static final char u300d = '\u300d'; // 」 - RIGHT CORNER BRACKET
    static final char uff09 = '\uff09'; // ） - FULLWIDTH RIGHT PARENTHESIS
    static final char u0021 = '\u0021'; // ! - EXCLAMATION MARK
    static final char u0025 = '\u0025'; // % - PERCENT SIGN
    static final char u0029 = '\u0029'; // ) - RIGHT PARENTHESIS
    static final char u002c = '\u002c'; // , - COMMA
    static final char u002e = '\u002e'; // . - FULL STOP
    static final char u003f = '\u003f'; // ? - QUESTION MARK
    static final char u005d = '\u005d'; // ] - RIGHT SQUARE BRACKET
    static final char u007d = '\u007d'; // } - RIGHT CURLY

最低0.47元/天解锁文章

小兵不出门

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
1
评论
解决itextpdf下，html转pdf后，首字符为标点符号问题

问题描述通过富文本框取到的HTML转成PDF后，PDF出现行首存在标点符号的情况。（存在Html标签属性失效的问题。）正常情况下，PDF文本内容，行首不能有标点符号网上找了很多答案，但是局限于各种版本，发现使用起来都是各种报错，以下为测试通过的可用版本。itextpdf版本5.5.11解决办法写一个类继承SplitCharacterpackage com.itextpdf.text;import com.itextpdf.text.pdf.PdfChunk;/** * &lt
复制链接

扫一扫