html自动转换doc,DOC转换为HTML后的变化

DOC转换为HTML后的变化

在Word 97中,当把DOC格式的文档存为HTML格式的文档时,Word会关闭文档,然后用超文本标记语言(HTML)格式应答。此后在Word中的显示方式与出现在Web览器中的方式类似。这时的创作环境不支持的格式和其他项目会从文件中删除。通过实践我们可以总结出转换时Word会更改或取消的内容,希望广大朋友注意。

●批注 系统会删除你用“插入”菜单中的“批注”命令插入的批注。不过,将文档保存为HTML文档后,你可以输入批注并显示“批注”样式。但浏览器显示该页时,不会显示批注。

●字号 字号会映射为最相近的有效字号,范围从1号到7号。这些字号并不是磅值,但Web浏览器用它们作为字号的指令。Word显示字号时是从9号到36号。

●动态文字 这里的动态文字是指在“格式”菜单中选择“字体”再选择“动态效果”标签中的动态效果修饰的文字。动态效果会丢失,但文字会保留下来。在Web页创作中,可在页中插入滚动文字。

●图形 图片和剪贴画等图形会转换为GIF(.gif)格式,除非图形已经是JPEG(.jpg)格式。文字框等图形对象无法转换,线条会转换为横线。

●制表符 制表符会转换为HTML制表字符,在HTML源中表现为“&#9”。制表符在某些Web浏览器中会显示为空格,所以你可以改用缩进或表格。

●域 域结果会转换为文字,系统会删除域代码。例如,你插入的是DATE域,日期文字会转换过来,但日期将无法继续更新。

●目录和索引 信息会转换过来,但索引和目录、图表目录在转换后无法自动更新,因为他们是以域代码为基础。目录会在页码处显示星号,这些星号是超级链接,我们单击该链接即可在Web页中漫游。也可以将星号替换为超级链接显示的文字。

●图形对象 这里所说的图形对象是如自选图形、文字效果、文本框和阴影等,图形对象无法保留。我们可以插入“Word图片”对象,在HTML文档创作中使用绘图工具。

●公式、图表和其他OLE对象 这些项目会转换为GIF图像。外观会保留下来,但你无法更新这些项目。

●表格 尽管在HTML文档的创作环境中不支持的设置会丢失,但表格会转换过来。系统不会保留彩色的,变换宽度的边框。

●表格宽度 按默认设置,表格会以固定宽度转换过来。如果要以宽度的百分比转换表格(以便表格的大小是相对于浏览器窗口调整的),可在下面的Windows 95注册表位置中设置选项PercentageTableWidth=1:HKEY_

LOCAL_ MACHINE\Software\Microsoft\Shared Tools\Text Converters\Export\HTML\Options。

●修订标记 用修订功能所做的修改会保留下来,但系统会删除该修订标记。

●页码 由于系统视HTML文档为单独的Web页,因此不管有多长,都会删除该文档的页码。

●页边距 你可以用表格来控制页面的版式。

●页面边框 HTML文档中没有页面边框的对应内容。在HTML文档中你可以用“格式”菜单中的“背景”命令来添加背景,使页面更具吸引力。你还可以在表格周围设置边框,并且可以用横线来帮助强调或分隔HTML文档的部分。

●页眉和页脚 HTML文档中没有页眉和页脚的对应内容,同样也没有脚注和尾注的对应内容。

●样式 用户定义的样式会转换为直接的格式。例如,你转换一个包含加粗和阴影格式的样式,加粗格式会保留为直接的格式,但阴影格式会丢失。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
你可以使用Apache POI库来读取和解析DOC文档,然后使用Thymeleaf模板引擎将内容转换HTML。以下是一个简单的示例代码: 1. 首先,确保在你的项目中添加了Apache POI和Thymeleaf的依赖。 2. 创建一个Controller类,用于处理上传的DOC文件和转换HTML的操作: ```java import org.apache.poi.hwpf.HWPFDocument; import org.apache.poi.hwpf.extractor.WordExtractor; import org.springframework.stereotype.Controller; import org.springframework.util.FileCopyUtils; import org.springframework.web.bind.annotation.PostMapping; import org.springframework.web.bind.annotation.RequestParam; import org.springframework.web.multipart.MultipartFile; import org.thymeleaf.TemplateEngine; import org.thymeleaf.context.Context; import org.thymeleaf.templateresolver.ClassLoaderTemplateResolver; import java.io.File; import java.io.FileOutputStream; import java.io.IOException; import java.io.InputStream; @Controller public class DocumentController { @PostMapping("/upload") public String uploadDocument(@RequestParam("file") MultipartFile file) throws IOException { // 保存上传的DOC文件 File docFile = convertMultipartFileToFile(file); // 读取DOC文件内容 HWPFDocument document = new HWPFDocument(FileCopyUtils.copyToByteArray(docFile)); WordExtractor extractor = new WordExtractor(document); String content = extractor.getText(); // 转换HTML String htmlContent = convertToHtml(content); // TODO: 在这里可以对HTML内容进行进一步处理,如保存到数据库或展示到页面 return "redirect:/"; } private File convertMultipartFileToFile(MultipartFile file) throws IOException { File convertedFile = new File(file.getOriginalFilename()); try (FileOutputStream fos = new FileOutputStream(convertedFile)) { fos.write(file.getBytes()); } return convertedFile; } private String convertToHtml(String content) { ClassLoaderTemplateResolver resolver = new ClassLoaderTemplateResolver(); resolver.setTemplateMode("HTML"); TemplateEngine templateEngine = new TemplateEngine(); templateEngine.setTemplateResolver(resolver); Context context = new Context(); context.setVariable("content", content); return templateEngine.process("document-template", context); } } ``` 3. 创建一个名为`document-template.html`的Thymeleaf模板文件,用于将DOC内容转换HTML。在模板中可以使用Thymeleaf的标签来渲染变量,如`[[${content}]]`。 ```html <!DOCTYPE html> <html lang="en" xmlns:th="http://www.thymeleaf.org"> <head> <meta charset="UTF-8"> <title>Document</title> </head> <body> <div th:utext="${content}"></div> </body> </html> ``` 这样,当你上传一个DOC文件时,它将被转换HTML,并可以在浏览器中显示。你可以根据自己的需求进一步处理HTML内容,比如保存到数据库或展示到页面。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值