java富文本(html)导出到 word (包括图片和文本内容)分别是url 和base64两种格式 - poi 和Jsoup; Jsoup.parse 获取body里面所有的子元素

39 篇文章 3 订阅
2 篇文章 0 订阅

		<dependency>
			<groupId>com.deepoove</groupId>
			<artifactId>poi-tl</artifactId>
			<version>1.12.0</version> 
		</dependency>

        <dependency>
			<groupId>org.jsoup</groupId>
			<artifactId>jsoup</artifactId>
			<version>1.14.2</version>
		</dependency>

富文本的图片是以url地址存储的(方案一)

富文本的图片是以url地址存储的
 public static void main(String[] args) throws Exception {
        String content = "<div class=\"media-wrap image-wrap\"><img src=\"http://192.168.1.16:9000/common/anchoremc-dynamic-server/20220803/1659512402215/file-20220803154002215.png\"/></div>\n</div><p>222</p>";
        Documents.DocumentBuilder of = Documents.of();
        Document document = Jsoup.parse(content);
        Element body = document.body();
        // 获取body里面的所有子元素
        Elements links = body.children();
        for (Element link : links) {
            Elements img = link.select("img");
            String src = img.attr("src");
            if(StringUtils.isNotBlank( src ) ){ // 处理图片
                of.addParagraph(Paragraphs.of(Pictures.ofUrl(src, PictureType.PNG).create()).create());
            }else { // 处理 文本
                Elements p = link.select("p");
                of.addParagraph( Paragraphs.of(p.text()).create() );
            }
        }
        DocumentRenderData data = of.create();
        XWPFTemplate template = XWPFTemplate.create(data);
        template.writeToFile("D:\\apps\\111.docx");

    }

富文本内容 base64图片(方案一)

public static String content() {
        String content = "<p><br></p><p style=\"text-align: start;\">111111111</p><p style=\"text-align: start;\">222222222</p><p style=\"text-align: start;\">333333333</p><p style=\"text-align: start;\"><img src=\"\" alt=\"\" data-href=\"\" style=\"\"></p><p><br></p>";
        return content;
    }

处理富文本里面的文本和图片(是base64格式的)

处理富文本里面的文本和图片(是base64格式的)
public static void main(String[] args) throws Exception {
        String text = WordUtil.content();
        Document document = Jsoup.parse(text);
        Documents.DocumentBuilder of = Documents.of();
        Elements links = document.getElementsByTag("p");
        for (Element link : links) {
            Elements p = link.select("p");
            Elements img = link.select("img");
            String src = img.attr("src");
            if(StringUtils.isNotBlank( src ) && src.contains("data:image/png;base64,") ){ // 处理图片
                of.addParagraph(Paragraphs.of(Pictures.ofBase64(src, PictureType.PNG).create()).create());
            }else { // 处理 文本
                of.addParagraph( Paragraphs.of(p.text()).create() );
            }
        }
        DocumentRenderData data = of.create();
        XWPFTemplate template = XWPFTemplate.create(data);
        template.writeToFile("D:\\apps\\111.docx");
    }

.

  • 2
    点赞
  • 23
    收藏
    觉得还不错? 一键收藏
  • 3
    评论
评论 3
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值