词典的具体格式

作者:李德辉

和奥普迪方的第一次谈话后决定把重心完全放到词典应用上了,目前的电子词典有很多不尽人意的地方。
目前存在的问题可以这样总结一下:

1.词典格式不良好
金山词霸将意思解释在前边,12345...,例子又全部在后边,你无法知道哪一个例子是对哪一个解释的。而且解释的也很不全,比如一个词有多个词性,adj,n一般会只解释最常用的。

2.多本词典反而造成混乱
看似几百本词典很猛,很全,但是全部加载进来以后,除了你可以漫无目的的拉动右边的滚动条外根锻炼身体以外,根本没有带来再多的好处。
多本词典中交叉重复的内容过多。
多本词典的格式不一致,造成用户疲乏。
多本词典中只有默认词典是有结构的,你查出来都不想看。

3.开放性造成混乱
金山词霸开放了用户词库,星际译王...呃
这里先谈一下星际译王...这个东西我对作者表示佩服,开源的英雄,前辈。
多年前您能想到这样的无限可扩展性确实不易。
星际译王的原理就是 key-text,一个词对应一段文本,文本你爱怎么写就这么写,无限扩展。
但是造成的就是用户好心加入的词库,可能其他人根本无法看懂,我就是其中之一。这里给一个例子,这是没有美化过多牛津词典查出来的结果:

abstract
/ 5AbstrAkt; `AbstrAkt/ adj 1 existing in thought or as an idea but not having a physical or practical existence 抽象的: We may talk of beautiful things, but beauty itself is abstract. 我们尽可谈论美的事物, 然而美本身却是抽象的. * He has some abstract (ie vague, impractical) notion of wanting to change the world. 他有一种要改造世界的空想. 2 (of art) not representing objects in a realistic way but expressing the artist's ideas and feelings about certain aspects of them (指艺术)抽象派的: an abstract painting, painter 抽象画, 抽象派画家. Cf 参看 concrete1

确实很混乱,虽然无限的扩展性,但是没有固定的格式,因此造成多本词典的不一致,随意性太大,你完全找不到你想要的东西。
金山的开发式词库只是在每一行的前边标明了1、2、3、4的行号,类似于星际译王。

我们要做到Sara系统:
1.只有一本统一的字典。
2.词典的结构是统一规定的标准,UI以不同着色的方式来显示这种规定好的结构,用户可以一眼找到自己想要的东西。
3.词典是完全开放的,但是用户做修改词库时修改的结果也必须是具有良好结构的,这样修改系统就必须要能够限制用户的修改还保持良好结构。

PS:
如果你要权威的内容,那么内容肯定是会很多的,电脑永远不可能知道你到底要abstract这个词哪一个词性的哪一个解释,你只能将起列出来,列出来的同时去考虑如何让用户在这一堆东西中尽快找到自己想要的,以及在找到他想要的东西之前不把显示器砸坏,这个才是我们要做的。

还有一点各种语言之间的格式并不是同一的,比如en-cn和cn-en可能查词的格式完全不一样,这一点必须对这两种词典进行研究,从语言学的角度入手,分析怎样的才是良好格式。

PS2:
我们要华丽的拿到第一,好的继续研究
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值