从人的需求看搜索领域的现在和未来(2)

一、           搜索的内容方面

1994年成立的Yahoo是最早涉及此领域的。当时的互联网虽然规模比起现在小的多,但是已经发生了寻找信息困难的问题。Yahoo解决的办法是针对网站为单位,建立分门别类的类别,大类别里嵌套子类别。这种方法很好适应了当时互联网发展初期寻找信息的需求。1998年,国内的搜狐提供了相类似的搜索。

此乃发展的第一阶段。

 

       但是发展总是不停止的,人的需求总是得满足的。第一阶段的搜索,现在从需求看来,至少有两点是存在问题的或者说是可以进一步提高的。第一,搜索的单位是网站,而不是具体的信息源;第二,寻找深层次的子类别将点击很多次,花的时间相应就长了。

       1998年成立的google,把搜索带进了一个全新的阶段,也是将搜索从功能变成产业的头号功臣。(顺便说一句,google真正为人们熟知并广泛应用大致是在2003年左右,一则说明google此前能够潜心那么多年,是很多国内公司做不到的;二则google1998年就可以看到或者预测到未来若干年的发展,的确显示了创始者对未来的深刻洞察力,这些都是我们值得学习的。)google的搜索是以文件为单位的,例如网页,各种各样得文档;搜索界面虽无创新,但却是简单实用的典范(这在第三方面会具体阐述);基于关键字的搜索。这个阶段的信息查找的时间和有效性方面都比第一阶段大大提高了。2000年,中国的百度提供了类似的服务。

此乃发展的第二阶段。

 

让我们回到原先提出的根本需求——迅速而有效的找到信息。Google和百度真能完美的解决这个问题吗。大家肯定是说“不”,幸好我也是这么想的。那么让仔细研究一下搜索过程包含的阶段。想象一下你搜索某个信息的全过程,1…2…3…OK。首先我们在脑海中出现要寻找的内容,这个内容是基于自然语言(就是你平时说的语言:中文,英文,法文,方言等等)的,然后你需要把基于自然语言的内容转化成若干关键字——这是第一个主要阶段;然后输入关键字,在搜索结果的界面寻找你真正想获得的信息——这是第二个主要阶段。举个具体的例子:如果我想去西藏自助旅游,我想知道详细的信息;我就先提取出关键字:西藏、旅游、自助;然后输入,在海量的结果中,寻找出对自己来说是有用的信息。

这两个阶段都存在着不少可以继续深入的方面。第一阶段,关键字毕竟不同于自然语言,意味着关键字不能包含所有的想表达的语言。虽然你经过努力,可以想出接近于语言表达的关键字组合,但这并不代表于相等。还举上例,如果我想得到去西藏自助旅游的详细信息,我不能把“详细”作为关键字输入,“详细”在此是作为意义呈现的,而不是关键字。这是基于自然语言搜索和关键字搜索的区别之一:自然语言搜索是基于意义搜索的,而关键字搜索是基于符号的。而且从自然语言转换成关键字,也需要付出相应的认知代价。第二阶段,由于搜索结果数量众多,在结果中寻找出所想要的信息,还是困难重重;而且信息与信息之间是相互分离的,提供的结果之间没有信息之间的相互关系存在。

顺着这两条思路下去。我们可以找到不少搜索引擎新的发展方向。比较简单的改进——我称之为第一阶段到第二阶段的过渡阶段。例如百度的分类搜索,对关键字进行不同分类的搜索——网页、图片、音乐等等,目的是为了简化搜索,使得结果集聚焦于某一个方面。

例如Vivísimowww.vivsimo.com成立于1998年),它也对关键字进行了分类,让人更感兴趣的是,它能根据临时所得到的搜索结果来进行动态的归类工作(相当于在结果和结果之间建立联系)。它的搜索结果会非常有条理地在页面左边汇整出Categories再把全部结果展现在你面前,让你非常清楚自己所寻找的结果到底是哪个类别。Vivísimo是我最喜欢的搜索引擎,因为它还支持中文。

让我们来看看第三代的搜索引擎的发展阶段。从先前分析的两条思路出发,我们可以各自找到其中的代表之一。Lexxe (www.lexxe.com2001年-2004年,现阶段还处于测试阶段)是一个基于自然语言的搜索引擎。lexxe引擎把用户打入文字当作语言来处理,而不是作为符号来处理。它的计算对象直接是语言,而不是一般符号,因为它具备了语言理解能力。Lexxe是一种很好的尝试,毕竟自然语言是语言学、心理学研究的难点之一。君不见微软、google等一批大公司投入巨大的人力、财力于此上面,就是为了满足人们即将产生的需求。Kartoowww.kartoo.com,2001年)是第一个非线性搜索引擎,它能对搜索结果进行分类,并给出结果之间的联系,形成网络状的搜索结果。网络状的结构符合人类长时记忆的特点,当然能够使得人们更快、更好的找到所需的信息。

       还有一个容易忽视的地方,就是搜索所包含的范围问题。什么意思呢?就是现在的搜索都是基于文字输入符号的方式进行搜索的。对于声音、图像等其他类型的符号,现阶段也只能根据其附属的文字符号信息来搜索。例如要寻找一首音乐,现在只能根据音乐的名称,而不能根据音乐的旋律来搜索。这方面被称之为多通道、跨通道的搜索,我估计这只在为数很少的实验室里有初级实验品产生。

       (我把很多公司推出产品的年份都列了出来,细心的读者是否能根据自己的经验看出某些门道呢。)

 

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值