导出Ueditor富文本带html标签内容为word文件

文章介绍了如何使用Java的Jsoup库将包含HTML标签的Ueditor富文本内容导出为Word文件。导出的关键在于理解Word本质上是HTML,通过解析和替换图片路径确保图片能正确显示。代码示例展示了解析和写出Word文件的过程。
摘要由CSDN通过智能技术生成

导出Ueditor富文本带html标签内容为word文件

工作中,遇到需要将富文本编辑的文章,公告,或者知识点,导出为word文件。
现在给出一套方案,希望能帮到需要的伙伴们。
导出为word的关键:Jsoup,参考:Jsoup

我们先来看一个图,这是导出后的word文件:
在这里插入图片描述
大家可以发现,用NotePad打开word文件后,其实word就是一个完整的html,注意图片的路径:其实就是本地的路径(相对远程导出来说,也是一样的,对于服务器,图片也应该是放在服务器本地下的某路径)。
那么知道word实际就是由html组成的以后,那么接下来就好理解了。

请大家自行去了解Jsoup。
jsoup是一款Java的HTML解析器,主要用来对HTML解析。
这里贴出代码,也是本文最关键的部分:

String str = " <!--[if gte mso 9]><xml><w:WordDocument><w:View>Print</w:View><w:TrackMoves>false</w:TrackMoves><w:TrackFormatting/><w:ValidateAgainstSchemas/><w:SaveIfXMLInvalid>false</w:SaveIfXMLInvalid><w:IgnoreMixedContent>false</w:IgnoreMixedContent><w:AlwaysShowPlaceholderText>false</w:AlwaysShowPlaceholderText><w:DoNotPromoteQF/><w:LidThemeOther>EN-US</w:LidThemeOther><w:LidThemeAsian>ZH-CN</w:LidThemeAsian><w:LidThemeComplexScript>X-NONE</w:LidThemeComplexScript><w:Compatibility><w:BreakWrappedTables/><w:SnapToGridInCell/><w:WrapTextWithPunct/><w:UseAsianBreakRules/><w:DontGrowAutofit/><w:SplitPgBreakAndParaMark/><w:DontVertAlignCellWithSp/><w:DontBreakConstrainedForcedTables/><w:DontVertAlignInTxbx/><w:Word11KerningPa
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值