多标记文件如何有效定位标记错漏

大家从我的历史博文以及我的自我介绍就能看出,我是一个十项全能的翻译人,不但做翻译,还做专业排版,特别是将排版的前期纳入翻译流程,从而大幅提高效;一言以蔽之,就是在双语对照环境中,将双语文本对齐,然后将排版相关标记从原文复制到译文中(2021年我给澳洲中文翻译协会做过一次线上讲座,进行过具体介绍)。

最近在完成联合国一个几百页的一个法律年鉴项目中,遇到了一个非常棘手的问题,接连好几天试图解决,都没成功,最终借助一个方法,高效解决。下面具体介绍一下,希望对大家有所借鉴。

首先,这个项目是一个IDML文件,有3000多个段落(上万的句子,几十万字),其中一多半段落有排版相关标记,比如斜体、粗体、交叉参照、外链等等。

按照惯例,我将并不需要翻译的书目部分,以及其他一些非译单元(比如数字等等),全部锁定,然后将需要翻译的部分专门做了一个视图,打开进行双语对照和标记恢复工作。完成后,我借助QA工具,完成文字质检和标记验证工作,导出中文IDML文件,没有报错,但用Indesign打开这个文件时,软件界面僵死,没有任何额外信息。我的直接告诉我,还是标记有问题。于是回到memoQ,继续进行QA,忽略或解决了一些不太严重标记问题,比如前后顺序颠倒,结果还是不行。之后,我又尝试用几个旧版本Indesign尝试,还是同样的僵死问题。

最后,我开始怀疑memoQ标记验证功能有缺陷,于是决定扩展一下,用自己的方法进行标记验证。

首先,为了避免遗漏,我将整个IDML文件打开,进行QA,然后制作一个专门选中“Unsupressed warning”(未抑制的警告)的视图,取名为 issues,然后将这个视图导出RTF。为了确保看清楚到底是什么标记出了问题,我在导出是专门选中了“Export the full text of inline tags”(导出线内标记的完整文本)。在Word打开RTF:

因为只是要对比原文连和译文列的标记,所以首先用Word的搜索替换功能,将黑色文本(其实Text 1风格)替换掉,只保留红色标记:

替换结果如下:

下面,我要借助谷歌大神Fraser的diff-match-patch在线工具 - https://neil.fraser.name/software/diff_match_patch/demos/diff.html,进行文本对比。具体步骤并入下:

首先,我将前两列内容选中,粘贴到diff窗口的Text Version 1文本框,然后将第二列删除,在选中前两列,复制粘贴到 Text Version 2。我之所以也让第一列参与对比,是因为这列带连续序号,可以清楚标记参与对比的文字属于那个翻译单元。按ComputeDiff,几秒钟后得到结果:

哈,一下子就看到了标记的异同!第一段,删除了两个nl,这个无关痛痒,因为nl是new line的意思,表示换行;因为中文通常比原文短,所以有些换行也就不需要了。看到第二段的那个删除的标记,我立马知道问题所在了。那行是这个出版物的销售编号,通常不用翻译,而且有时还需要整个删除(比如这次这个项目)。在制作双语对照文件时,对于整个删除的内容,我会用三个空格代替(因为memoq对于整个删除的内容,会认为是没有翻译,在导出时会恢复原文,而这不是我想要的)。但这次,因为匆忙,我在用三个空格代替是,没有看到原文中有个起始标记,所以等于把这个标记也删除,而且在制作后续工作所使用的视图时,把这行也排除在外了,所以这个漏网之鱼一直没有被发现和纠正:

 第四行也有类似问题,赶紧一并解决:

 后面又发现了一些标记问题:

 

但这些标记都是根据具体译文专门添加的,只要成对添加就没有问题,所以忽略了。继续看,又有新的发现:

 

 124这个,必须修正(涉及斜体风格)。125这个,其实是换了顺序,没有问题。

后面又忽略了一些标记问题,然后重新导出IDML文件用Indesign,问题依旧,。。。

最后,决定采用二分法排除问题,经过将近10次循环之后,最后筛查到下面一些段落:

把那些换行标记恢复之后,导出的IDML终于能正常打开了!这就太奇怪了,这些标记只涉及换行,按理说不会导致IDML结构问题,怎么就无法到开呢?我最终猜测,这些标记会影响版面文字流动,因为某个或某些换行凑巧造成大量计算,所以导致程序僵死。

另外,我发现一个规律,在Indesign打开文件时,那个绿环光标如果一直显示(并不闪烁),那程序基本而言就是僵死了。而如果每个几秒钟就闪烁一下,那么说明程序并未真正僵死,只需多等待一会,就会正常打开。

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值