搜 索 引 擎 分 类

搜索引擎按其工作方式主要可分为三种,分别是全文搜索引擎(Full Text Search Engine)、目录索引类搜索引擎(Search Index/Directory)和元搜索引擎(Meta Search Engine)。

 ■ 全文搜索引擎

  全文搜索引擎是名副其实的搜索引擎,国外具代表性的有Google、Fast/AllTheWeb、AltaVista、Inktomi、Teoma、WiseNut等,国内著名的有百度(Baidu)。它们都是通过从互联网上提取的各个网站的信息(以网页文字为主)而建立的数据库中,检索与用户查询条件匹配的相关记录,然后按一定的排列顺序将结果返回给用户,因此他们是真正的搜索引擎。

  从搜索结果来源的角度,全文搜索引擎又可细分为两种,一种是拥有自己的检索程序(Indexer),俗称“蜘蛛”(Spider)程序或“机器人”(Robot)程序,并自建网页数据库,搜索结果直接从自身的数据库中调用,如上面提到的7家引擎;另一种则是租用其他引擎的数据库,并按自定的格式排列搜索结果,如Lycos引擎。

     

 

 ■ 目录索引

  目录索引虽然有搜索功能,但在严格意义上算不上是真正的搜索引擎,仅仅是按目录分类的网站链接列表而已。用户完全可以不用进行关键词(Keywords)查询,仅靠分类目录也可找到需要的信息。目录索引中最具代表性的莫过于大名鼎鼎的Yahoo雅虎。其他著名的还有Open Directory Project(DMOZ)、LookSmart、About等。国内的搜狐、新浪、网易搜索也都属于这一类。

      

 

 ■ 元搜索引擎 (META Search Engine)

  元搜索引擎在接受用户查询请求时,同时在其他多个引擎上进行搜索,并将结果返回给用户。著名的元搜索引擎有InfoSpaceDogpileVivisimo等(元搜索引擎列表),中文元搜索引擎中具代表性的有搜星搜索引擎。在搜索结果排列方面,有的直接按来源引擎排列搜索结果,如Dogpile,有的则按自定的规则将结果重新排列组合,如Vivisimo。

  除上述三大类引擎外,还有以下几种非主流形式:

  1、集合式搜索引擎:如HotBot在2002年底推出的引擎。该引擎类似META搜索引擎,但区别在于不是同时调用多个引擎进行搜索,而是由用户从提供的4个引擎当中选择,因此叫它“集合式”搜索引擎更确切些。   2、门户搜索引擎:如AOL Search、MSN Search等虽然提供搜索服务,但自身即没有分类目录也没有网页数据库,其搜索结果完全来自其他引擎。   3、免费链接列表(Free For All Links,简称FFA):这类网站一般只简单地滚动排列链接条目,少部分有简单的分类目录,不过规模比起Yahoo等目录索引来要小得多。  

  由于上述网站都为用户提供搜索查询服务,为方便起见,我们通常将其统称为搜索引擎。

阅读更多

对引索优化问题

04-17

1、尽量避免对索引列进行计算 rnrn 根据这句话的意思我开始了自己的测试rnrn[code=SQL]rnSQL> desc a05;rnName Type Nullable Default Comments rn----- ------------- -------- ------- --------------------------------------------- rnA0500 VARCHAR2(2) Y 门店 rnA0501 VARCHAR2(6) 人员编码 rnA0502 VARCHAR2(10) Y 人员姓名 rnA0503 VARCHAR2(10) Y 简称 rnA0504 VARCHAR2(32) Y 密码 rnA0505 VARCHAR2(255) Y 后台权限 rnA0506 VARCHAR2(1) Y 前台权限: 0-超级 1-收款组长 2-普通款员 5-禁用 rnA0507 VARCHAR2(4) Y 所属部门 rnA0508 VARCHAR2(8) Y 前台角色 rnA0509 CHAR(1) Y 查询权限:0-个人 1-部门 2-分店 3-总店 rnA0510 VARCHAR2(8) Y 后台角色 rnA0511 DATE Y 入职日期 rnA0512 DATE Y 离职日期 rn[/code]rn(1)rn 我先不建索引走了一下。rn[code=SQL]rnSQL> select count(*) from gjh_a05;rnrn COUNT(*)rn----------rn 4753rnrnExecuted in 0.078 secondsrn[/code]rnrn[code=SQL]rnSQL> select * from gjh_a05 where a0506>'5' and rownum<2;rnrnA0500 A0501 A0502 A0503 A0504 A0505 A0506 A0507 A0508 A0509 A0510 A0511 A0512rn----- ------ ---------- ---------- -------------------- -------------------------------------------------------------------------------- ----- ----- -------- ----- -------- ----------- -----------rn10 5166 宋宁 bxtp 5 6 0603 13 0 0 rnrnExecuted in 0.078 secondsrnrnSQL> select * from gjh_a05 where a0506>5 and rownum<2;rnrnA0500 A0501 A0502 A0503 A0504 A0505 A0506 A0507 A0508 A0509 A0510 A0511 A0512rn----- ------ ---------- ---------- -------------------- -------------------------------------------------------------------------------- ----- ----- -------- ----- -------- ----------- -----------rn10 5166 宋宁 bxtp 5 6 0603 13 0 0 rnrnExecuted in 0.109 secondsrnrnSQL> select * from gjh_a05 where a0506>5 and rownum<2;rnrnA0500 A0501 A0502 A0503 A0504 A0505 A0506 A0507 A0508 A0509 A0510 A0511 A0512rn----- ------ ---------- ---------- -------------------- -------------------------------------------------------------------------------- ----- ----- -------- ----- -------- ----------- -----------rn10 5166 宋宁 bxtp 5 6 0603 13 0 0 rnrnExecuted in 0.031 secondsrnrnSQL> select * from gjh_a05 where a0506>'5' and rownum<2;rnrnA0500 A0501 A0502 A0503 A0504 A0505 A0506 A0507 A0508 A0509 A0510 A0511 A0512rn----- ------ ---------- ---------- -------------------- -------------------------------------------------------------------------------- ----- ----- -------- ----- -------- ----------- -----------rn10 5166 宋宁 bxtp 5 6 0603 13 0 0 rnrnExecuted in 0.078 secondsrnrnSQL> select * from gjh_a05 where a0506>'5' and rownum<2;rnrnA0500 A0501 A0502 A0503 A0504 A0505 A0506 A0507 A0508 A0509 A0510 A0511 A0512rn----- ------ ---------- ---------- -------------------- -------------------------------------------------------------------------------- ----- ----- -------- ----- -------- ----------- -----------rn10 5166 宋宁 bxtp 5 6 0603 13 0 0 rnrnExecuted in 0.093 secondsrnrn[/code]rn根据这些数我无语了。rnrna0506 是一个varchar 型。。它和''比较效率应该更高才对。可是怎么就低了呢。。rn

没有更多推荐了,返回首页