技术文档中新词难词易错词汇总(不断更新中)

原创 2006年05月18日 18:12:00
all about
一直没有找到好的译法,今天一个译者的译法似乎值得推荐:“……的全部就是……”。

address

动词。我经常拿这个词作为评判一本字典成色的石蕊试纸。中国人自己编写的字典几乎都只有“发表讲话”之类的义项。而实际上,技术文献中屡屡见到的意思是讨论讲述某某主题。从此词的一个义项deal with发展而来。

affordance

出自Professional Ajax p1, par.-2 "which began to bring the affordances of desktop software interfaces into the confines of the browser screen"
一个用户界面、认知心理学方面的术语,网上的几种解释:
available

can not emphasize more/too much

怎么强调都不过分。

coherent
Anders Hejsberg在《.NET设计规范》(Framework Design Guidelines,2006 Jolt生产效率大奖得主,中文版人民邮电出版社图灵公司即出)的序里用到这个词,形容框架的质量。似乎第一感是一致,而微软的译者译为易于理解的,乍一看似乎突兀,实则不然。查查字典,可以发现这个词远比想像中的复杂。

dot the i
给i加点,形容极为细致。

elegant
这个词在各种技术文献中非常常见。词源是 Elect,选择的意思。一般的翻译是优雅,但是不符合技术氛围。有sophiscated的意思,用来修饰Design等等比较合适。Jargon File的释义为”Combining simplicity, power, and a certain ineffable grace of design. Higher praise than ‘clever’, ‘winning’, or even cuspy.“(小王子的作者Antoine de Saint-Exupéry将其解释为”不可多一分,不可少一分“。)
牛津高阶有一个elegant的义项:clever and simple,也就是简洁、简练。很好。

enclosure
(RSS和Atom提要的)附件。这个词原意就是信的附件。Wikipedia上用a way of attaching multimedia content to feeds解释。RSS中用enclosure标签实现,每个提要只能附加一个附件;Atom中用<link rel="enclosure"实现,可以同时附加多个附件。要注意的是,这里的附件只是指向多媒体文件的链接,与邮件中的附件不同。此词有一种译法是闭包,显然是与closure混淆了。

finalizer
垃圾回收中的一个术语。MSDN中文版中有的不翻译,有的译为终结器。考虑到与构造方法/析构方法的一致性,建议翻译为终结方法

gotcha
Jargon File的定义是计算机程序、编程语言中的一种不良特性(misfeature),很容易导致出乎意料的bug和错误。比如C语言中的等号错误(用=表示相等)暂译为意外特性。当然可以根据上下文处理得更为流畅通顺。

Greenwich
格林尼治。旧译格林威治,估计最早的译者并不知道,这里的w不发音。

hit testing
用户界面编程中的常见术语,但是Google中只能搜索到两条解释。

hash
散列。旧译哈希,我们读书时教材都这么叫,目前还有很大的遗毒。估计是最早翻译此词的老兄误以为是人名了,所以采取了音译。

munge
出自Martin Fowler的PEAA前言,讲数据可以被read, munged and written。一般字典都查不到,还是得找New Hacker Dictionary。“verb, used in a derogatory sense, meaning to imperfectly transform information”。

nontrivial

take off
出自Professional Ajax p4 par.-1 "the development of Ajax-type interfaces really took off"
这里的take off是指某种概念、产品迅速流行(become successful very quickly)之意。

trade-off
常见的翻译是权衡,也不能说错,但是中文读上去别扭(权衡的中文意思是秤锤和秤杆,比喻衡量考虑,动词)。比如“解释了这些规范的许多权衡”,名词其实译为利弊或者优劣更好,动词译为利弊权衡比较清楚。尤其是几种方案之间的比较。比较常见的误译是折中。几乎都是不通的。也是国内字典不佳带来的遗毒。

workaround
权宜之计临时补救措施。相关的术语还有kluge,hack,quick and dirty,等等。

Texas A&M University=得克萨斯A&M大学
美国最大的公立大学之一,学校自己有民航机场,计算机系排名很不错,C++他爸Bjarne Stroustrup就在这里任教。中文翻译有几种:得克萨斯|德州+农工|农机|A&M+大学。查国内有译名确立效力的新华网,似乎都有。该校的中国留学生自己也在讨论。不过这里有一位华裔的学校高层网页,应该有一定的权威性。另外,中央电视台(有校长的专访)也支持这种形式。姑且从之好了。

Simon Fraser University=西蒙·弗雷泽大学
加拿大名校。得名于同名的探险家西蒙·弗雷泽

Carnegie Mellon University(CMU)=卡耐基-梅隆大学
要注意的是,卡耐基和梅隆是两个姓,分别代表美国钢铁大亨Andrew Carnegie和另一个家族Mellon。所以常见的那种卡耐基·梅隆大学的译法是错误的。

参考
Jargon File
Wikipedia(via Answer.com)
名词委标准
微软VS.NET词汇表
台湾资讯学会的词汇表

自然语言处理---新词发现---生成二元组

record: 生成二元组 #coding:utf-8 ''' Created on 2014年10月15日 @author: shifeng ''' import codecs #-------...
  • u010454729
  • u010454729
  • 2014年10月15日 23:35
  • 1270

word2vec找文本相似词小试牛刀

preface: 找出语料中跟某个词类似的词。 word2vec作为google的一个开源工具,比较强大,效果也比较好,便试试。 一、工具 下载:http://word2vec.googlecode...
  • u010454729
  • u010454729
  • 2015年10月20日 11:48
  • 3244

分词,新词发现和热词发现

作者:Invoker 链接:https://www.zhihu.com/question/20969452/answer/16755849 来源:知乎 今年上半年,我在人人网实习了一段时间,期间得到...
  • smartcat2010
  • smartcat2010
  • 2017年09月07日 16:46
  • 2417

[转]基于大规模语料的新词发现算法

对中文资料进行自然语言处理时,我们会遇到很多其他语言不会有的困难,例如分词——汉语的词与词之间没有空格,那计算机怎么才知道“已结婚的和尚未结婚的”究竟是“已/结婚/的/和/尚未/结婚/的”,还是“已/...
  • heiyeshuwu
  • heiyeshuwu
  • 2015年01月22日 18:35
  • 2224

学习资料网站汇总__不断更新

1、Python机器学习库 http://qxde01.blog.163.com/blog/static/67335744201368101922991/
  • Sbtgmz
  • Sbtgmz
  • 2016年04月12日 22:07
  • 681

java使用Nagao算法实现新词发现、热门词的挖掘

采用Nagao算法统计各个子字符串的频次,然后基于这些频次统计每个字符串的词频、左右邻个数、左右熵、交互信息(内部凝聚度)。 名词解释:   Nagao算法:一种快速的统计文本里所有子字符串频次的...
  • shuyun123456789
  • shuyun123456789
  • 2016年12月15日 15:26
  • 1520

【中文分词系列】 8. 更好的新词发现算法

如果依次阅读该系列文章的读者,就会发现这个系列共提供了两种从0到1的无监督分词方案,第一种就是《【中文分词系列】 2. 基于切分的新词发现》,利用相邻字凝固度(互信息)来做构建词库(有了词库,就可以用...
  • AMDS123
  • AMDS123
  • 2017年04月03日 00:35
  • 7670

搜索词纠错(拼写检查)、相关搜索的原理与实现

相关搜索是检索功能的一个扩展,用来告诉用户自己输入查询词的情况。 如果输入错了,可能会纠错提示用户:“想找的是不是”      。 另外还会在显著位置提供与输入查询词相关的其他查询词,例如百度结果页下...
  • lgnlgn
  • lgnlgn
  • 2013年04月05日 12:58
  • 5939

新词发现初研究

60%的分词错误是由新词导致的 一、新词的概念   目前,在中文分词领域出现了新词(New Words)和未登录词(Unknown Words)两种概念。很多研究者并没有对未登录词和新词加以区别,认为...
  • helihongzhizhuo
  • helihongzhizhuo
  • 2016年01月05日 16:39
  • 2536

【自然语言处理系列】新词发现算法——转自matrix67博客

今年上半年,我在人人网实习了一段时间,期间得到了很多宝贵的数据,并做了一些还算有意义的事情,在这里和大家一块儿分享。感谢人人网提供的数据与工作环境,感谢赵继承博士、詹卫东老师的支持和建议。在这项工作中...
  • piaoxuefengqi
  • piaoxuefengqi
  • 2014年01月16日 17:11
  • 2679
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:技术文档中新词难词易错词汇总(不断更新中)
举报原因:
原因补充:

(最多只允许输入30个字)