怎样使用Oxygen XML Editor将MS Word转换成DITA

3 篇文章 0 订阅
2 篇文章 0 订阅
本文介绍了如何利用OxygenXMLEditor和BatchDocumentConverter插件将MSWord文档转换为DITA格式,以便于内容管理和重用,详细步骤包括清理格式、安装插件、设置转换选项并进行审核调整。
摘要由CSDN通过智能技术生成

▲ 搜索“大龙谈智能内容”关注公众号▲ 

前阵子分享过一篇文章:《如何将Word/PDF转成高质量XML》

文章中分享了将Word/PDF转换成高质量XML的思路和大体步骤。有朋友问:有什么工具可以做这个数据转换,具体怎么操作呢?

今天就来分享一种将MS Word转换成DITA的工具和步骤。 

- 1 -

目的

在开始结构化写作之前,企业已经拥有了大量的文档。这些文档主要使用MS Word进行编写。

为了更好地进行内容管理和维护(支持重用),企业需要将这些现存的MS Word格式的文档转换为DITA格式。转换过程完成后,企业就可以使用DITA格式进行文档的维护和升级,确保内容的一致性和准确性。

- 2 -

工具

今天我们使用Oxygen XML Editor来进行转换。

Oxygen XML Editor是罗马尼亚的SyncRO Soft公司研制的一款XML文档编辑器。

Oxygen XML Editor默认不带内容转换功能,需要安装一个叫做批量文档转换器(Batch Document Converter)的插件。 

安装批量文档转换器插件

1)运行Oxygen XML Editor

2)点击菜单:帮助 -> 安装新的加载项

3) 在弹出窗口”安装新的加载项“中选择”Batch Document Converter“,然后点击”下一步“

4)在”许可证和签名“页的下方选择”我接受最终用户许可协议的所有条款“,然后点”安装“按钮

5)安装完成后,关闭并重新启动Oxygen XML Editor

6)可以看到菜单:工具 -> 批量文档转换器,这里有将多种格式转换的选项

- 3 -

操作步骤

1)清理MS Word文件内容的格式

转换的第一步是清理MS Word内容的格式,确保内容使用正确的MS Word格式(俗称”刷格式“)并且整个文档一致。

比如:标题1的内容确实使用”标题1“格式,而不是用”正文“并使用二号字来表示。 只有标题1才会被转换成DITA标题,正文将被转换成段落。 

请从头到尾根据需要设置文字的格式,确保Word文件的内容使用正确的格式。

2)运行Oxygen XML Editor并打开菜单:工具 -> 批量文档转换器,选择”Word到DITA"

3)在”Word到DITA"窗口,点击“添加文件”,将刷好格式的Word文件选择进来

4)设置“转换选项” - [可选]

Oxygen XML Editor默认对转换进行了配置,点击“转换选项”可以看到这些配置。根据需要可以对配置进行调整。 

一般情况下我们使用默认的配置即可。 

5)点击“转换”按钮进行转换

工具将MS Word转成DITA并放到word文件所在目录的output子目录下。

它生成一个ditamap文件和多个dita文件。

6)对转换好的DITA文件进行审核和调整

在Oxygen XML Editor中选择菜单:文件 -> 打开,并选择ditamap,就可以看到转换好的DITA文件了。 

从工具栏选择“带属性的完整标记”,切换到显示标记模式。从左侧的目录中双击并打开文件, 逐个检查生成的ditamap和dita文件中的内容和标签是否和期望的一样,并根据需要做相应修改。 

这样我们就将MS Word转换成DITA。如果有任何问题,请评论区留言和我交流。


摩拿科技是罗马尼亚SyncRO Soft公司授权软件增值经销商(Software Value Added Reseller)并提供技术服务

请微信扫码了解

oXygen XML Editor是一个多平台的XML编辑器(里诺下载站提供),XSLT / XQuery的调试器和分析器具有完整的Unicode支持。它提供了一个强大的代码洞察力,可以遵循DTD,RELAX NG或者XML架构,甚至可以从部分编辑过的文档学习的结构。XML和XSL文档可以容易地相关联的一个与另一个和变换结果可以被看作是文本或HTML。oXygen XML Editor提供了W3C XML模式的可视化模式编辑器和RELAX NG模式旨在简化架构文件的开发和理解。oXygen验证XML,XSL和XQuery,FO,XSD,RNG,RNC,NRL,DTD的Schematron,WSDL和CSS内容,报告与描述和行号信息错误,以及将它们标记在文档中时,验证您键入时启用。更多的文件可以被逻辑地组织在项目中。它配备了最新的Docbook DTD和样式表。   包括Apache的FO处理器,能够生PDF和PostScript。其他FO处理器可以配置为插件。oXygen在调试模式进入,以显示来源和侧样式表文件侧,也显示效果和特殊的调试视图时提供了一个特殊的布局。调试和分析可以使用的Xalan,Xalan, Saxon 6 or Saxon 8转化引擎的最新版本来完。动态呈现的输出,因为它是由变换过程完全与映射源和样式表产生的。一个完整的diff和合并的解决方案也提供oXygen。它提供了目录和文件比较,6档差异算法。oXygen通过包括Subversion客户端,使内容创作者之间更容易文档共享。svn客户端,您可以浏览库,检查变化,提交改变,更新你的工作副本并检查修订历史。oXygen支持导入数据库内容,微软Excel表和传统的文本数据文件到XML文档,也为从数据库表生XML Schema的支持。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值