怎样使用Oxygen XML Editor将MS Word转换成DITA

3 篇文章 0 订阅
2 篇文章 0 订阅
本文介绍了如何利用OxygenXMLEditor和BatchDocumentConverter插件将MSWord文档转换为DITA格式,以便于内容管理和重用,详细步骤包括清理格式、安装插件、设置转换选项并进行审核调整。
摘要由CSDN通过智能技术生成

▲ 搜索“大龙谈智能内容”关注公众号▲ 

前阵子分享过一篇文章:《如何将Word/PDF转成高质量XML》

文章中分享了将Word/PDF转换成高质量XML的思路和大体步骤。有朋友问:有什么工具可以做这个数据转换,具体怎么操作呢?

今天就来分享一种将MS Word转换成DITA的工具和步骤。 

- 1 -

目的

在开始结构化写作之前,企业已经拥有了大量的文档。这些文档主要使用MS Word进行编写。

为了更好地进行内容管理和维护(支持重用),企业需要将这些现存的MS Word格式的文档转换为DITA格式。转换过程完成后,企业就可以使用DITA格式进行文档的维护和升级,确保内容的一致性和准确性。

- 2 -

工具

今天我们使用Oxygen XML Editor来进行转换。

Oxygen XML Editor是罗马尼亚的SyncRO Soft公司研制的一款XML文档编辑器。

Oxygen XML Editor默认不带内容转换功能,需要安装一个叫做批量文档转换器(Batch Document Converter)的插件。 

安装批量文档转换器插件

1)运行Oxygen XML Editor

2)点击菜单:帮助 -> 安装新的加载项

3) 在弹出窗口”安装新的加载项“中选择”Batch Document Converter“,然后点击”下一步“

4)在”许可证和签名“页的下方选择”我接受最终用户许可协议的所有条款“,然后点”安装“按钮

5)安装完成后,关闭并重新启动Oxygen XML Editor

6)可以看到菜单:工具 -> 批量文档转换器,这里有将多种格式转换的选项

- 3 -

操作步骤

1)清理MS Word文件内容的格式

转换的第一步是清理MS Word内容的格式,确保内容使用正确的MS Word格式(俗称”刷格式“)并且整个文档一致。

比如:标题1的内容确实使用”标题1“格式,而不是用”正文“并使用二号字来表示。 只有标题1才会被转换成DITA标题,正文将被转换成段落。 

请从头到尾根据需要设置文字的格式,确保Word文件的内容使用正确的格式。

2)运行Oxygen XML Editor并打开菜单:工具 -> 批量文档转换器,选择”Word到DITA"

3)在”Word到DITA"窗口,点击“添加文件”,将刷好格式的Word文件选择进来

4)设置“转换选项” - [可选]

Oxygen XML Editor默认对转换进行了配置,点击“转换选项”可以看到这些配置。根据需要可以对配置进行调整。 

一般情况下我们使用默认的配置即可。 

5)点击“转换”按钮进行转换

工具将MS Word转成DITA并放到word文件所在目录的output子目录下。

它生成一个ditamap文件和多个dita文件。

6)对转换好的DITA文件进行审核和调整

在Oxygen XML Editor中选择菜单:文件 -> 打开,并选择ditamap,就可以看到转换好的DITA文件了。 

从工具栏选择“带属性的完整标记”,切换到显示标记模式。从左侧的目录中双击并打开文件, 逐个检查生成的ditamap和dita文件中的内容和标签是否和期望的一样,并根据需要做相应修改。 

这样我们就将MS Word转换成DITA。如果有任何问题,请评论区留言和我交流。


摩拿科技是罗马尼亚SyncRO Soft公司授权软件增值经销商(Software Value Added Reseller)并提供技术服务

请微信扫码了解

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值