自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(34)
  • 收藏
  • 关注

原创 江伟不爱PDF

总体来说,江伟的“魔鬼翻译词典”词条是一个充满幽默和讽刺的方式,旨在强调与PDF文件相关的专业挑战。pdfobia: 对PDF文件(尤其是含有大量列、图表和图片的文件)的厌恶,特别是当你的客户项目经理发送给你进行翻译并要求你返回一个完全格式化的Word文件时。注意:这里的翻译是尽量保持原文的幽默和讽刺意味,但由于文化和语言的差异,部分词汇和表达可能在中文中的效果与英文有所不同。江伟的两个“魔鬼翻译词典”词条充满了幽默和讽刺,明显地表达了他对基于PDF的翻译和排版的不满。

2023-08-07 11:07:06 941

原创 Windows 11 上 WSL2 Docker 容器如何启用 GPU

这里说一点我的经验,CUDA每次升级,并不会把之前的旧版本删除:不同版本的CUDA是安装在不同文件夹下,以不同的版本号区分,而且会在系统变量里加上这些不同版本号以及相应路径,这样不同的程序要想调用相应的CUDA版本,读取相应的系统变量即可。疫情初期,开始在Windows 10上玩Docker容器,有幸成功安装和使用了几个基于WSL2的容器,比如FB的LASER项目,但一直无法使用Windows的显卡,在网上找到一些攻略,望而却步了。我一向奉行“拿来主义”,不能轻松拿来的,我是不太会继续费力不讨好的。

2023-08-05 22:52:09 1152

原创 阿飞之死(故事新编)

阿飞佝偻着身子,忍者剧痛,勉强没有倒下。他抹了一把胸的血窟窿,看着满手的鲜血,喃喃地问道,“你刚才用的什么兵器?但阿飞无论往哪个方向都能刺,无论往哪个部位都能刺!他能往臂下刺,往胯下刺,从耳旁刺。他能向前刺,向后刺,向左右刺。他的剑法没有“削”,没有“截”,只有“刺”!刚要使出他的“绝命掏裆反手刺”,但耳听得“啪”的一声脆响,浑身一震,感觉被什么东西猛地刺穿了!对方冷笑一声,挥了挥手里的家伙,说道:“是长枪,刚刚从东洋买的三八大盖儿!但阿飞的身后也似长着眼睛,身子突然一缩,刺,本来只有向前刺。

2023-07-17 11:54:25 120

原创 如何找到那个我曾经排好版的相似Indesign文件?

我从前的排版项目,都有一个将原生的INDD文件转存成IDML文件的步骤,而且为了将IDML文件中的书签和变量部分提取出来,我还用7-zip将IDML解压缩,这样就能得到想要的XML文件(话说到这里,还请memoQ考虑一下我的这个需求,因为在很多情况下,ID文件中的书签和变量确实是需要翻译的,而据我所知,memoQ在导入IDML文件时,并未对书签和变量进行解析)。这个尺寸不常做,但看版面,非常眼熟,从前肯定做过,于是我偷懒的本能油然而生。下面要做的,就是在以前做过的Indsign排版项目中,找到同样尺寸的。

2023-07-15 11:15:19 188

原创 当排版师遇到“不一致才准确”(Inconsistency Is Accuracy)

赶稿感到半夜,刚刚睡下,就听见有人敲门,我不情愿地打开门,看到两个黑衣人站在门口,西装革履,戴着墨镜,一脸严肃。我一听就急了,说,你们CIA,管天管地,还管人敲字儿做翻译?按照我的惯常做法,我会在memoQ的双语环境正完成已对齐文字的编辑以及排版(即插入排版标记),这样的话那些一摸一样的原文,就会因为memoQ的自动沿用功能而造成本来就不一致的译文变得一致了,这当然是不行的。(之所以放在段尾,是为了不影响本来文字的排序,而加上方括号和尖括号,则是为了和已有的数字区分开,以便日后统一删除)

2023-06-19 15:44:09 227

原创 多标记文件如何有效定位标记错漏

在制作双语对照文件时,对于整个删除的内容,我会用三个空格代替(因为memoq对于整个删除的内容,会认为是没有翻译,在导出时会恢复原文,而这不是我想要的)。完成后,我借助QA工具,完成文字质检和标记验证工作,导出中文IDML文件,没有报错,但用Indesign打开这个文件时,软件界面僵死,没有任何额外信息。首先,为了避免遗漏,我将整个IDML文件打开,进行QA,然后制作一个专门选中“Unsupressed warning”(未抑制的警告)的视图,取名为 issues,然后将这个视图导出RTF。

2023-05-23 03:26:39 237 1

原创 从“驴肉火烧”到“烧火肉驴”

从前有个做驴肉火烧的老板,每个月都买来一头驴,杀掉做驴肉火烧。这天他又买了一头,刚要杀,那头驴竟然开口说话了。它说,老板老板,求求你别杀我,我给你干什么都行!老板觉得非常诧异,就问它能干什么?驴说,我会给你烧火做饭,然后老板就让它试一试,它果真能烧火做饭,于是把它留了下来。驴就从驴肉火烧,变成了烧火肉驴。看呀,会一门手艺,有多重要!

2023-03-21 11:33:51 116

原创 Word闪退,几个意思?

它给出的最后一条建议,立马提醒了我,干嘛非要在Word里进行正则替换?虽然同样费时,但在专门为Java预留的64G内存的加持下,到现在已经运行半个多小时了,内存使用稳定在40G左右,感觉最后会成功完成替换。我一开始以为是正则表达式有问题,于是挑了一些在RegexBuddy里验证,没发现问题(确实也不应当出现问题,因为这些正则都是自动生成的,已经在过去一年时间里,经过多个项目的考验)。几百个极其复杂的正则表达式,对几千条长短不一的段落进行搜索替换,结果在运行到3%的时候Word闪退,没有任何具体信息。

2023-03-18 23:42:48 364

原创 字幕翻译,如何合并和拆分过分断句

如果字数比较多,我通常会问客户能不能增加一两个小时的预算,原因很简单:过分断句(over-segmentation)对译员很不友好,特别是在使用CAT (computer-aided translation)的情况下,而合并句段、译后重新断句(post-segmentation),以及在原始视频中导入翻译好的字幕,进行在线/屏上检查(online/on-screen checking),这一切都需要更多时间,而这一切的成果,客户是喜闻乐见的,那就是客户可以直接拿来用的字幕文件。

2022-12-13 15:08:46 1398 1

原创 整理只有大小写不同的译文修改列表 - 正则表达式妙用之2

首先我用语料对齐工具,将英中文字进行段段对齐,将生成的翻译记忆库(其实成为bitext更贴切)导入memoQ点LiveDocx,继而对已导入memoQ的Indesign IDML文件进行预翻译,然后逐段对文字进行核对,主要是纠正个别未对齐的句段和恢复排版标记(我称之为解决“技术问题”),以及更正文字错漏,包括不一致的译法(我称之为解决”翻译错误”)。最下面的,就是我想要的最终结果,即以制表符分隔的双列文本,左列是要搜索的文字,右列是要替换成的文字(两列内容一样,只不过大小写有区别)。

2022-10-11 11:33:41 598

原创 本地化项目巧用正则表达式-系列文章1

首先描述一下问题,那就是搜索汉字字符串,这个字符串前后有圆括号(具体点,就是全角的圆括号),开括号前面有1到多个大写英文字母和一到多个阿拉伯数字的编号,写成正则表达式就是: (?在核对这些替换(删除)实例时,我发现有一些不一致(即原文有国名的地方也标出来了),于是给客户发邮件询问这些地方是否也要删除,并且跟要他们修改之后的英文版文件。

2022-09-15 22:42:07 190

原创 巧用Word和Excel整理更改列表

第一步,从前后两个版本的译文,整理一个修改对照表。为了防止overshoot(把不该替换的内容替换掉),以及undershoot(本来需要替换的内容未被替换掉),就要求修改的内容有一定的上下文,这个上下文不能太多,也不能太少。这些天做一个英中排版项目,遇到一个问题,感觉很有典型意义:在memoQ中的译文本来已经定稿了,都导入Indesign开始排版了,客户又突然要求修改两个关键术语的译法,总共有几百处,但又不是所有和这两个术语对应的译文都修改,也就是说,原来的译法是“多到多”,修改后的译法还是“多到多”!.

2022-08-15 11:13:58 559

原创 PDF带标注页提取程序

最近一个排版项目,我在原版PDF中发现了一些英文文本的一些错漏,于是在Acrobat中进行了批注,今天想把这个带批注的PDF发给客户,发现有几十M,于是想到瘦身,只把带批注的几页发给客户。明白了吗,“批注”的英文是Annotation,我简称Anno,“阿诺”,也就是硬汉阿诺德·施瓦辛格的名字。这个程序,其实是在用脚本驱动Acrobat程序,所以,你的机器上必须安装了Adobe Acrobat程序(不是Acrobat Reader),才能使用我这个程序。瘦身文件只有不到4兆,不错吧!............

2022-08-14 14:01:25 506

原创 巧用Word通配符为英中双语字幕文件中的简体中文制作一份副本

我所采用的简繁改写流程是完全自动化的,即运行程序,将简体中文文字转换为繁体中文(不是使用Word自带的那个简繁改写功能,而是自编的一个工具)。^0013]{1,})意思是将任意汉字连同其前面1到5个字符(换行和软换行除外)和其后不限个数的字符(换行和软换行除外)找到,并且为了只找到以软换行开头的那个中文行副本,特地加上了^0011。还不错吧,下面要做的,就是把右列英文全部选中,然后施加隐藏风格,保存文件后,用我那个自编工具进行简繁转换就行了。但,懒人出巧匠,我还是想找个更巧妙、更通用的流程。...

2022-07-18 14:56:42 568

原创 浅谈英语的修饰范围

大家知道,英文中有些结构是后置的,即放在所修饰中心词的后面,比如介词或动名词放在动词或名词的后面,比如 The hunter shot a tiger in the zoo. 这句话其实是有歧义的:猎人射杀了公园内的一只虎 vs 猎人在公园射杀了一只虎。歧义在于,前者表明了公园和虎的依存关系,而后者表明了射杀这个动作和公园这个空间的依存关系。......

2022-06-24 14:47:33 319

原创 巧用Vlookup、If、Or等函数解决数据合并问题

哈,看了这个题目,千万别以为我是搞大数据的。我就是一介翻译匠,只不过想方设法让自己的工作不那么繁重罢了!上周进行一个软件界面的翻译工作,因为缺少上下文,所以在在客户发来的字串列表(一个Excel文件)中单起了一列,针对一些需要客户提供上下文或进行进一步解释的子串提了一些问题。客户今天发来了回复(新加了一列),就像这样:对照这个回复,修改我的译文,是没问题的。但我现在的所有翻译项目,都是用memoQ完成的。这个CAT软件支持导出和导入双语表格形式的RTF文件,其中就包含一个“注释”(Comment

2022-05-17 14:42:40 1877

原创 Space as a craft: catch that crafty space(空格控:抓住那个 狡猾的空格)

今天,咱们聊聊space craft。 (ÒωÓױ)!Sorry,我是说space as a craft。也就是,把空格(或者说空白)作为一个“手艺”研究一下。做翻译、做排版,快30年了。我对空格,或者说任何空白,都非常敏感。我从小就知道“白”是紧跟在“穷”后面的,所谓“一穷二白”。所以,小时候过惯了穷苦的日子,落下病根儿了,长大了对啥空白都那么敏感。好像又扯远了。拉回来,拉回来!可是,你可能会问:空格(空白)有什么可聊的,不就是你在键盘上按大拇哥低下那个最长的键,出现的那个看不见又摸.

2022-05-15 12:10:31 1331 2

原创 译文加词和调序的两个例子

我的英中翻译项目经常会涉及调查问卷,而里面经常会有 your company的说法,遇到这个,我会非常谨慎,通常会翻译成“您所在的公司”、“贵公司”、“你们公司”,而很少翻译成“您的公司”或“你的公司”。为什么呢?我总感觉中文的“谁谁的”有很强的归属性。如果直译成“你的公司”,就好像公司是你开的一样。通常,填写调查问卷的很少是企业主本人,而很有可能只是公司的一位职员。...

2021-10-02 17:34:59 189

原创 翻译不过脑子,能把人笑抽的错误你见过几个?

1. 几年前有个项目,里面提到一款医疗设备,如果发现有故障,就寄回厂家,他们提供service,修好后,再寄回来,然后就可以继续投入service了。你猜怎么着?那个译者把两个service都翻译成“维修”了。我靠,没完没了地反复修,谁受得了!2. 还是几年前,是用于机器设备的警示标签,上面粗体字写着,维修前,须将电源锁定(Lock out the power source)。这个标签总共没几个字,那个翻译还是把“电源”打成了“店员”。请自行脑补一下:这台机器安装在某快餐厅里,突然坏了,维修人员马上赶到

2021-09-28 13:44:51 168

原创 Docker error 138 & 135

用着好好的Docker,突然就报138错误,上网一搜,原来是Docker升级,和老镜像不太兼容了。上网搜,找到这个https://github.com/microsoft/WSL/issues/4694y一言以蔽之:Create file : %userprofile%.wslconfig Add this two lines : [wsl2] kernelCommandLine = vsyscall=emulate Restart wsl wsl --shutdown Restar

2021-09-19 12:35:12 83

原创 import win32api, sys, os ImportError: DLL load failed: The specified module could not be found.

这几天,终于不再用Notepad++,而改用Pycharm,来做Python编程了。今天早上运行一个调用Win32api的程序,开始报错:import win32api, sys, osImportError: DLL load failed: The specified module could not be found.在ImportError: DLL load failed: win32api, sys, os · Issue #23 · michaelgundlach/pyspeech .

2021-09-17 09:56:49 945 2

原创 Word里替换问题,没有一个通配符搞不定的,如果有,那就用两个

今天收到个翻译项目有点奇葩,是个从PDF转来的docx文件。导入memoQ后,发现字数比客户统计多了很多。再仔细一看,发现很多字符串被断开了。于是返回Word,看到的是:于是将所有文字选中,在字体对话框的“高级”选项卡里,将“缩放”、“间距”和“位置”作如下设置。然后看到的是:看来客户当初用来讲PDF转成Word格式的工具,无法正常处理填表字段。看着这些下划线字符,真是糟心,于是用通配符进行替换:这个通配符的意思是,下划线后面跟至少一个并非下划线和回车的字符,替...

2021-09-17 08:29:30 337

原创 Tomcat9 服务无法启动(WIndows 11)

用的好好非 Tomcat9 今天突然无法用了,看服务状态,是停止卵,反复手动启动也不成功, 查 日志,说无法加载 jvm.dll突然想起,操作系统早些时候更新了Java,一查 Java 的安装目录,果然是变了。上网搜,有个帖子提到Tomcat 有个设置工具叫Tomcat9w.exe。在Tomcat的安装目录的bin子目录,果然找到这个程序,运行后,到Java选项卡,看到Java Virtual Machine果然指向旧的文件夹:勾选 Use default,,确定退出后,再次手动..

2021-09-06 18:46:32 1471

原创 万物互联的时代:要隐私,还是要效率?

今天做翻译,看着Crop Burning,用某狗输入法,本来想打“庄稼焚烧”,提示的却是“庄家焚烧”。差点笑出声来,但再一想,觉得很有意思。打麻将,有个术语,叫“臭庄”,就是庄家首先出牌,打出一张没用的,比如红中,结果三个下家接连打出红中,这样的话,庄家就要立马掏钱,赔给三个下家。现在这个“庄家焚烧”,是不是也是搞死家的意思?或者至少表达了一些股民的心声?某狗输入法,早已用上了云计算,说白了,就是采集每个用户的输入内容,优化输入法。而某狗的机器翻译,口碑也相当不错(坦白讲,我就用某狗翻译)。机器

2021-09-03 10:22:46 122

原创 再回考场:说说昨天晚上做的(又)一个奇怪的梦

这一辈子,我做过N多个回到学校、考场、职场的梦。做过的梦,大多忘记了,但昨天晚上这个,趁着记忆犹新,赶紧记录下来:那年,我已经参加了英语专业的博士考试,数理化各科都有,就像高考那样,只不过是同时发下来,在一场持续几个小时的考试内完成。我从初中开始学英语以来,一直偏科,英语考试总是满分,或者差一两分钟满分,而且其他各科则参差不齐,理科特别差。那场考试很狼狈,很多题目都上涨,英语还行,交卷之后没多久,听说自己考上博士了。没有感觉太高兴。但后来,就有了这个梦。不知为什么,那次考试作废了,需要重考(至少是一

2021-09-02 06:50:34 127

原创 Student teachers是啥:千万别轻易怀疑原文有误

今天早上客户又发来一个英中翻译项目,和上周完成的那个是同一客户,经过对比,发现是同一篇文字经过更新了。我对这种小幅度更新的项目青睐有加,因为可能轻松获得更多额外翻译费,哈。文中提到,根据疫情,客户(美国一所研究和教学中心)所在的大厦可能会收紧或放开访客接待。上周文件中有一句话提到 long-term student teachers and interns,而且这次更新也原样保留了。我看到我原来的译文是“长期学生、教师和实习生”,又想到“访客”,突然觉得这里有问题。学生和教师真的算“访客”吗?我上次认为

2021-09-01 07:38:18 558

原创 一个惊出一身冷汗的误译

用CAT做翻译,经常会发现以前译文的错漏。有时心里会稍有不安,但通常会马上给自己找个理由:今天发现了以前的错误,哈,我在不断进步呀!于是,心安理得。但今天发现的这个错漏,却让我惊出了一身冷汗,因为逻辑完全错了。说真的,我不敢在这里贴原文,因为我担心,最终客户哪天在上网搜索,搜到我这篇博文,然后再找到我的客户(国外一家翻译公司),我的客户再找到我,那我就 play egg 了。但无论如何,这个错误具有反思意义,所以决定模拟原句,新编一句:We will include all the discover

2021-08-28 16:08:31 173

原创 UnSelect All:到底说的啥?

今天这个英中翻译项目是个软件系统的界面,里面出现 Select All 和 UnSelect All。前者意思很明确,就是全选、选择全部、选择所有。后面这个呢?我见过图省事的,在 Select All 译法前面加个”取消“的,即取消全选、取消选择全部、取消选择所有。貌似没问题,而且这些译法非常流行,但其实里面可能有个逻辑问题,好像之前必须“全选”过,现在后悔了,于是“取消全选”。实际上,UnSelect All 是个偷懒操作,就是无论当前选择状态如何,全都变为未选中状态,也就是“全都不选”,或者说“全部

2021-08-26 19:32:59 637

原创 如何避免“的”字串烧

最近一个英中翻译项目中遇到这么一句话:Following are highlights of some of the more highly discussed topics, with the full agenda available online.以下是一些讨论度较高的主题的要点,完整的议程可在网上查阅。译文是从搜狗机译修改来的。我一向对两个“的”字结构(“的”字串烧)比较敏感,因为在字面上,xxx的yyy的zzz是有歧义的:(xxx的yyy的)zzz,即两个的字结构是并列的形容词结构(有

2021-08-24 09:36:21 103

原创 Excused/Unexcused,咋翻译?

今天早上为昨天做完第一稿的一个英中翻译项目做质检,QA工具提示Excused这个词的翻译有问题:扫了一眼,觉得是误报,但再一想,感觉excuse翻译成“请假”是有问题的。我们经常说的“Excuseme”,好像都是在“请假”(请求别人原谅自己),但其实都是在请对方”准许“自己做某事。所以,excuse的本意就是”准假“。咱们再回到报错的这句话,这里说的是学生缺勤,学校通知家长。学校说的excused or unexcused,到底啥意思?通常而言,学校作为学生的管理者,应当是比较强势的,通常会把是否.

2021-08-24 07:23:37 323

原创 从两个单词再谈消除歧义的重要性

今天接到的一个翻译小件非常有意思,有两个单词有明显歧义,弄不好就会掉坑里。先看第一个:第一个report,很容易理解,就是“报告”,但第二个就比较微妙了。意思其实是“报道”,或者说“到校上学”。如果你翻译成“向学校报告”,那就大错特错了!再看第二个:哈,一句话中出现两个contact,要小心哟!第二个是”联系“,第一个是”接触“,是指与新冠肺炎确诊病例有过接触,而”接触跟踪人员”是指社区或学校负责对密切接触者进行通知和随访的人。你要是弄成“联系追踪人员”,那就不知所云了!..

2021-08-16 22:37:29 91

原创 从 Eligibility 浅谈英中翻译消除歧义的重要性

在英汉字典中查 eligibility,给出的解释通常就是“合格”、“有资格”。我在翻译实践中,也经常将这两种译法互换。今天早上接到一个项目,却突然发现无法换用,而且如果不小心用错,后果不堪设想。这是系列翻译项目中的一个,是美国中小学县学区(County School District)面向新移民家庭的电子通讯,其中很多是关于学生有资格参加 TESOL的。TESOL是英文English to Speakers of Other Languages的缩写,意思是“非英语母语者英语教学”。现在这个文件的

2021-08-10 08:11:29 408

原创 google n-grams 怎么玩

玩法多多:1.先看一下这篇知乎文章 - “一个玩得停不下来的Google神器:Ngram”,了解一下背景:https://zhuanlan.zhihu.com/p/201654832. 在线玩 - Google Books N-gram Viewer (请自备梯子):https://books.google.com/ngrams3. 跟着这篇英文博文玩:https://yarlett.github.io/efficient-querying-of-google-books-ngram-da..

2021-08-04 12:08:05 3037

原创 Windows命令行出错后如何重置%errorlevel%

关于这个问题,SO上已有热烈的讨论:https://stackoverflow.com/questions/1113727/what-is-the-easiest-way-to-reset-errorlevel-to-zero我感觉,最高效、最简洁,非 cd. 莫属!对,cd后面加个黑点,就这三个字符(cd后面不必用空格哟!)有图有真相,哈!...

2021-08-04 09:35:36 433

AI_expText.jsx

AI_expText.jsx

2022-09-23

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除