▲ 搜索“大龙谈智能内容”关注公众号▲
前阵子分享过一篇文章:《如何将Word/PDF转成高质量XML》。
文章中分享了将Word/PDF转换成高质量XML的思路和大体步骤。有朋友问:有什么工具可以做这个数据转换,具体怎么操作呢?
今天就来分享一种将MS Word转换成DITA的工具和步骤。
- 1 -
目的
在开始结构化写作之前,企业已经拥有了大量的文档。这些文档主要使用MS Word进行编写。
为了更好地进行内容管理和维护(支持重用),企业需要将这些现存的MS Word格式的文档转换为DITA格式。转换过程完成后,企业就可以使用DITA格式进行文档的维护和升级,确保内容的一致性和准确性。
- 2 -
工具
今天我们使用Oxygen XML Editor来进行转换。
Oxygen XML Editor是罗马尼亚的SyncRO Soft公司研制的一款XML文档编辑器。
Oxygen XML Editor默认不带内容转换功能,需要安装一个叫做批量文档转换器(Batch Document Converter)的插件。
安装批量文档转换器插件
1)运行Oxygen XML Editor
2)点击菜单:帮助 -> 安装新的加载项
3) 在弹出窗口”安装新的加载项“中选择”Batch Document Converter“,然后点击”下一步“
4)在”许可证和签名“页的下方选择”我接受最终用户许可协议的所有条款“,然后点”安装“按钮
5)安装完成后,关闭并重新启动Oxygen XML Editor
6)可以看到菜单:工具 -> 批量文档转换器,这里有将多种格式转换的选项
- 3 -
操作步骤
1)清理MS Word文件内容的格式
转换的第一步是清理MS Word内容的格式,确保内容使用正确的MS Word格式(俗称”刷格式“)并且整个文档一致。
比如:标题1的内容确实使用”标题1“格式,而不是用”正文“并使用二号字来表示。 只有标题1才会被转换成DITA标题,正文将被转换成段落。
请从头到尾根据需要设置文字的格式,确保Word文件的内容使用正确的格式。
2)运行Oxygen XML Editor并打开菜单:工具 -> 批量文档转换器,选择”Word到DITA"
3)在”Word到DITA"窗口,点击“添加文件”,将刷好格式的Word文件选择进来
4)设置“转换选项” - [可选]
Oxygen XML Editor默认对转换进行了配置,点击“转换选项”可以看到这些配置。根据需要可以对配置进行调整。
一般情况下我们使用默认的配置即可。
5)点击“转换”按钮进行转换
工具将MS Word转成DITA并放到word文件所在目录的output子目录下。
它生成一个ditamap文件和多个dita文件。
6)对转换好的DITA文件进行审核和调整
在Oxygen XML Editor中选择菜单:文件 -> 打开,并选择ditamap,就可以看到转换好的DITA文件了。
从工具栏选择“带属性的完整标记”,切换到显示标记模式。从左侧的目录中双击并打开文件, 逐个检查生成的ditamap和dita文件中的内容和标签是否和期望的一样,并根据需要做相应修改。
这样我们就将MS Word转换成DITA。如果有任何问题,请评论区留言和我交流。
摩拿科技是罗马尼亚SyncRO Soft公司授权软件增值经销商(Software Value Added Reseller)并提供技术服务
请微信扫码了解