这篇文档关于能够提高翻译效率的正则表达式的使用方法和技巧,主要面向文科小白,如果你是IT大佬,请移步~(本文节选自 大辞科技官网文章《 正则表达式篇(一):认识正则表达式在辅助翻译软件中的应用-大辞科技》)
先说好,我不是程序猿/媛。推荐正则不是让大家写代码,纯粹是想要分享一下自己在进行翻译的时候能够提高翻译效率的一些小技巧~ (反正正则就是谁用谁说好~)
正则是个什么鬼?
我们看看正则是怎么定义的:
正则表达式(regular expression)描述了一种字符串匹配的模式(pattern),可以用来检查一个串是否含有某种子串、将匹配的子串替换或者从某个串中取出符合某个条件的子串等。
听不懂,先放放定义。没关系,定义不重要,有啥作用和咋用比较重要。请继续。
为啥用正则?
第一,当然是为了提高搜索效率。
比如,你可能通过正则搜索以下场景:
- 在一个文件中,你想搜索“cat”这个词,但不搜索含有cat这个单词的其它词,如catalogue、cataract、catch等类似的词;
- 你收集了一些用户信息,其中包含:中文姓名、联系电话、电子邮件等,那你可能希望检查用户填写的信息是否符合标准,那你就可以试试搜索“手机号为1开头的11位数字”;
- 收到译文后,你想看看译员翻译的日期到底对不对,那你可能会搜索一下日期,是不是格式一致;
- 还有你可能会想看看有没有两个连续空格啊,特殊符号啊等等。
第二,反正搜索有时候就是为了替换的嘛,所以用正则也是为了提高替换的效率。
- 在一个文件中,你想把“size”替换为“isize”,但不替换含有size的其它词,如oversize等类似的词;
- 在进行网站英译汉本地化的过程中,原文中的超链接网址都会变为标签,所以你可能希望把所有的标签网址中的