搜索引擎存在问题

 211  查全率和查准率低

  不论使用哪种搜索引擎, 在实际使用中, 查准率、查全率和响应时间仍然是用户最关心的基本问题。然而, 目前还没有一种搜索引擎能覆盖因特网全部资源, 即使功能最完善的搜索引擎也只能找到Web 上大约1/ 3的网页, 查全率也就无法保证。另一方面, 由于网络资源的海量、繁杂无序、网页的无效链接、查询结果重复、结果为镜像点、结果指向其他页面或链接、找到的页面打不开、信息已过期等问题, 都大大降低了搜索引擎的查准率。212  网页作弊问题搜索引擎成为网络用户获取信息的一个不可或缺的检索工具, 就有了针对搜索引擎网页排名的作弊现象。早期最常见的作弊方法是重复关键词, 查找一个“中国”就出现130 多万个结果。有些站点为了容易被其他著名站点选中, 以期提高该站点的地位, 在网页中重复某些关键字,并没有增加用户所需的有用信息, 却增加了用户查看信息的负担。在有了网页排名以后,“超链分析”排序技术成了作弊者利用的工具。他们创建成百上千个没有实质内容的网站, 目的就是增加某个网页的链接数量, 而网页被其他网页链接得越多, 排名越靠前, 但信息内容并不一定越有价值, 不相关信息排在前面, 甚至暴露给用户有害信息,这就极大地降低了查准率, 而且误检、漏检率相当高。

213  安全性问题

搜索引擎功能越来越强大, 有渗透到Internet 每一个角落的趋势。据美国News - Factor Network 进行的一项非正式调查显示: 任何具有不良意图的人通过搜索引擎即可轻松找出信用卡号码、相关个人数据及最近交易记录。再如,Google 记录网站内容的能力可以被用来查明有安全漏洞的网站。搜索引擎的安全漏洞无意中给黑客等有恶意的人可乘之机。他们通常以匿名用户的身份通过搜索引擎这个网络代理, 利用其成千上万的网络链接, 搜索有缺陷的网站、配置不当的系统和FTP 服务器上的敏感信息, 以及保护不利的私人信息和机密文件等, 侵入并进行恶意破坏。这使搜索引擎被当作匿名代理而成为黑客的戴罪羔羊。

214  检索功能问题

目前, 网络检索主要功能是对全文数据库、书目数据库、检索工具索引的查询, 但检索点太少, 不能做到从多方面对检索式进行限制。另外, 搜索引擎不能自动识别错别字。由于用户对某一概念、名人的名字的正确书写不了解, 出现笔误等情况时有发生, 如果用户误输入错别字,而搜索引擎不能自动给出正确关键词的提示, 就可能在检索结果中找不到所需信息。此外, 目前的检索引擎大多数都只能识别文本检索词, 不能接受图像、图形、图表、音频、视频等多媒体检索词。假如用户看到一副图画, 想查找有关图画的信息就十分困难。

215  信息更新不及时

网络信息每100 天增长1 , 搜索引擎不仅需要及时补充新信息, 同时还应定期将过期无价值信息删除, 如一些无效链接、打不开的网页等; 综合类搜索引擎数据库庞大, 不易更新, 信息质量也难以保证。低质量及无效信息降低了搜索引擎查准率, 也影响了用户方便快捷地获取有价值的信息。

216  搜索引擎的规范化问题

21611  检索词没有规范化

关键词之间存在着大量同义现象、近义现象、一词多义和同形异义现象, 而搜索引擎极少进行规范化处理, 致使文献和检索提问中隐含的概念或需求往往难以表达出来,漏检率较高, 甚至有时影响检准率。例如, 使用“互联网”一词与使用“因特网”一词进行检索, 检索结果的相同率仅为5 %。由此可见, 如果用户使用某一关键词而没有使用同义词检索的话, 漏检率之高不言而喻。

21612  汉字切分问题

对汉字的切分问题目前有两种处理方法, 一种是按单汉字检索, 这虽然能保证很高的检全率, 但误检率高, 于是又提出了对字与字之间的位置限定。位置的限定可以减少一些虚假组配, 但基于单汉字的检索仍然会带来很多垃圾信息。例如, 在百度里输入“智能化搜索引擎”, 正确的切分是把它看成一个单一的概念, 像“目前全球惟一的智能化搜索引擎客客———文章收藏”这一搜索结果就是正确的, 而“教你如何才能智能化解析搜索引擎结果———21CN. COM- IT频道”这一结果就没有正确切分汉字。

21613  同一结果重复出现

由于同一篇文章可以方便在多个地方发表, 而有些搜索引擎不加以处理, 所以常常可以在检索结果中发现大量重复信息, 它们的网址虽然不同, 但却链接在同一个页面上, 用户费时费力打开却发现同样的内容, 使用户浪费了时间和精力。

21614  查询接口标准问题

由于目前对用户查询接口的定义尚缺乏通用的标准,各种搜索引擎给出了不同的实现方式, 很不统一, 如有的搜索引擎使用自然语言查询接口, 有的是逻辑查询语法结合各种限制选项等。这使用户在使用不同搜索引擎时常常不得不采用不同的检索策略, 增加了用户检索负担。__

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值