无处不在
除了对理解搜索意图方面的改善和对自身知识组织与管理能力的提高之外,未来的搜索引擎还有两个方向会继续发展,其一就是无处不在,也就是针对分布式计算来说的.
记得以前讨论搜索的未来这个话题时,我曾经提出,从技术上讲,搜索引擎要继续发展,需要从两个学科上进行提高与突破,一是智能性,二是分布式计算.我们前面提到的两点,都是在智能性上展开的思考,那么在本小节上,我们需要考虑分布式方向.但这与笔者的工作内容与积累不一致,所以只是粗浅的说说自己的想法,期待有更专业的人士对此和大家继续分享看法.
搜索的分布式体现在两个方面,一是外在表现上,搜索将无处不在.任何可存储或传输数字化信息的设备上,都可以进行相关信息的检索.二是搜索的计算上,这个”搜索”的计算是由远程大型机提供的,还是由若干个分布式系统来提供的,甚至是把计算扩展到任何可以分配计算任务的任何网络节点上,由群体协作完成的.
这对搜索的意义是巨大的.
现在的搜索引擎主要存在于一些主要的网络终端上,比如联入互连网的计算机.搜索的计算服务由部分搜索引擎厂商来分别提供,比如google或baidu.但我相信,搜索的未来随着分布式特性的发展,整个网络都将会有一个新的革命,我们后面将试图展示这种新时代.
所以,搜索的未来第三个表现就是充分挖掘分布式计算的能力,将自身扩展到每一个可以扩展的角落.
无所不含
这另一个方向,就是无所不含,也就是说,人类要搜索的信息对象,载体不一定全是语言文字.只是由于笔者工作领域的限制,以及现有搜索引擎的核心特征,所以上面的讨论多限于自然语言的处理上.
事实上现在的搜索引擎已经对此有初步的体现,比如google的GoogleEarth软件,baidu的前些日子吃了官司的mp3音乐搜索.这其中以模式识别和图象处理为代表,与自然语言理解与处理相对,也是人工智能的内容.只不过信息的载体已经不同.
但我想,图象的处理从某种意义上讲比自然语言处理还滞后.比如,对于图象,它可以变换到某个数学空间上进行处理,或者变换,过滤毛刺,给不同图象做相似度比较,但如果我说我需要找一些秋天伤感的图片,或碧云天,黄叶地,或秋风紧,北雁南飞的那种,计算机能进行哪怕是初步的处理吗?
也就是说,语言是有语义的,虽然像个烫手的山芋,但自然语言处理学界是认识到语义的重要性的,并试图在这方面进行突破.但图象处理方面并没有看到相关资料,虽然事实上图象也是有意义的.(不过也可能我不是这个领域的,所以孤陋寡闻,见笑)
目前的搜索引擎对图象库的处理,只怕是人工整理,或者依据图象的命名来检索的:仍然是处理的文字符号.
搜索的未来,第四个表现就应该是扩展计算对象,实现多类型信息(多学科)纵向发展,搜索无所不含.