Google搜索全攻略

 

 

使用Google进行简单搜索对于网民而言不陌生。但是,你可以发现,单个关键字搜索引擎,搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢?我们需要进一步缩小搜索范围和结果。  

1、初阶搜索

1.1、搜索结果要求包含两个及两个以上关键字

一般搜索引擎需要在多个关键字之间加上+,而Google无需用明文的+来表示逻辑操作,只要“ ”(空格)就可以了。现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上有搜索引擎历史两个关键字。

示例:搜索所有包含关键词搜索引擎历史的中文网页

搜索:搜索引擎 历史

结果:已搜索有关搜索引擎 历史的中文(简体)网页。 共约有78,1.00项查询结果,这是第1-10项 。 搜索用时0.31.秒。

用了两个关键字,查询结果已经从70多万项减少到7万多项。但查看一下搜索结果,发现前列的绝大部分结果还是不符合要求,大部分网页涉及的历史,并不是我们所需要的搜索引擎的历史。 怎么办呢?删除与搜索引擎不相关的历史。我们发现,这部分无用的资讯,总是和文化这个词相关的,另外一些常见词是中国历史世界历史历史书籍等。

1.2、搜索结果要求不包含某些特定信息

Google用减号-表示逻辑操作。AB表示搜索包含A但没有B的网页。

示例:搜索所有包含搜索引擎历史但不含文化中国历史世界历史的中文网页

搜索:搜索引擎 历史 -文化 -中国历史 -世界历史

结果:已搜索有关搜索引擎 历史 -文化 -中国历史 -世界历史的中文(简体)网页。 共约有31.,800项查询结果,这是第1-10项 。 搜索用时0.22秒。

我们看到,通过去掉不相关信息,搜索结果又减少了将近一半。第一个搜索结果是:

搜索引擎直通车≡搜索引擎发展历史

搜索引擎直通车, ... 搜索引擎专业介绍站点. ...

www.se-express.com/about/about.htm - 14k - 网页快照 - 类似网页

非常符合搜索要求。另外,第八项搜索结果:

41.3搜索王

本站检索 整个网站 在此输入关键词. 你的当前

位置:首页 >> Internet搜索手册 >> 搜索引擎的历史. ...

www.cnco.net/search/history.htm - 21k - 网页快照 - 类似网页

也符合搜索要求。但是,10个结果只有两个符合要求,未免太少了点。不过,在没有更好的策略之前,不妨先点开一个结果看看。点开se-express.com的这个名为搜索引擎发展历史的网页,我们发现,搜索引擎的历史,是与互联网早期的文件检索工具Archie息息相关的。此外,搜索引擎似乎有个核心程序,叫蜘蛛,而最早成型的搜索引擎是Lycos,使搜索引擎深入人心的是Yahoo。了解了这些信息,我们就可以进一步的让搜索结果符合要求了。

注意:这里的“ ”-号,是英文字符,而不是中文字符的。此外,操作符与作用的关键字之间,不能有空格。比如搜索引擎 - 文化,搜索引擎将视为关键字为搜索引擎文化的逻辑操作,中间的-被忽略。

1.3、搜索结果至少包含多个关键字中的任意一个。

Google用大写的OR表示逻辑操作。搜索A OR B,意思就是说,搜索的网页中,要么有A,要么有B,要么同时有AB在上例中,我们希望搜索结果中最好含有archielycos蜘蛛等关键字中的一个或者几个,这样可以进一步的精简搜索结果。

示例:搜索如下网页,要求必须含有搜索引擎历史,没有文化,可以含有以下关键字中人任何一个或者多个:Archie蜘蛛LycosYahoo

搜索:搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo -文化

结果:已搜索有关搜索引擎 历史 archie OR 蜘蛛 OR lycos OR yahoo -文化的中文(简体)网页。 共约有8,400项查询结果,这是第1-10项 。 搜索用时0.11.秒。

我们看到,搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求。如果你想了解一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧。

注意:操作必须用大写的OR,而不是小写的or

在上面的例子中,我介绍了搜索引擎最基本的语法”“,这三种搜索语法Google分别用“ ”(空格)、-OR表示。顺着上例的思路,你也可以了解到如何缩小搜索范围,迅速找到目的资讯的一般方法:目标信息一定含有的关键字(用“ ”连起来),目标信息不能含有的关键字(用-去掉),目标信息可能含有的关键字(用OR连起来)。

2、杂项语法

2.1、通配符问题

很多搜索引擎支持通配符号,如*代表一连串字符,?代表单个字符等。Google对通配符支持有限。它目前只可以用*来替代单个字符。比如,*治国,表示搜索第一个为,末两个为治国的四字短语,中间的*可以为任何字符。

2.2、关键字的字母大小写

Google对英文字符大小写不敏感,GODgod搜索的结果是一样的。

2.3、搜索整个短语或者句子

Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格)。但是,用短语做关键字,必须加英文引号,否则空格会被当作操作符。

示例:搜索关于第一次世界大战的英文信息。

搜索:“”world war I””

结果:已向英特网搜索"world war i". 共约有937,000项查询结果,这是第1-10项 。 搜索用时0.01.秒。

2.4、搜索引擎忽略的字符以及强制搜索

Google对一些网路上出现频率极高的英文单词,如icomwww等,以及一些符号如*.等,作忽略处理。

示例:搜索关于www起源的一些历史资料。

搜索www的历史 internet

结果:以下的字词因为使用过于频繁,没有被列入搜索范围: www . 已搜索有关www的历史 internet的中文(简体)网页。 共约有75,100项查询结果,这是第1-10项 。 搜索用时0.22秒。

我们看到,搜索www的历史 internet,但搜索引擎把www都省略了。于是上述搜索只搜索了历史internet。这显然不符合要求。这里我顺便说一点搜索引擎分词的知识。当我们在搜索www的历史的时候,搜索引擎实际上把这个短语分成三部分,www历史分别来检索,这就是搜索引擎的分词。所以尽管你输入了连续的www的历史,但搜索引擎还是把这个短语当成三个关键字分别检索。

如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的+号。

搜索:+www +的历史 internet

结果:已搜索有关+www +的历史 internet的中文(简体)网页。 共约有25,000项查询结果,这是第1-10项 。 搜索用时0.05秒。

另一个强制搜索的方法是把上述的关键字用英文双引号引起来。在上例"world war I"中,I其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语。

搜索:"www的历史" internet

结果:已搜索有关"www的历史" internet的中文(简体)网页。 共约有7项查询结果,这是第1-1.项 。 搜索用时0.21.秒。

我们看到,这一搜索事实上把www的历史作为完整的一个关键字。显然,包含这样一个特定短语的网页并不是很多,不过,每一项都很符合要求。

注意:大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。

3、进阶搜索

上面已经探讨了Google的一些最基础搜索语法。通常而言,这些简单的搜索语法已经能解决绝大部分问题了。不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。

3.1、对搜索的网站进行限制

site表示搜索结果局限于某个具体网站或者网站频道,如www.sina.com.cnedu.sina.com.cn,或者是某个域名,如com.cncom等等。如果是要排除某网站或者域名范围内的页面,只需用-网站/域名

示例:搜索中文教育科研网站(edu.cn)上关于搜索引擎技巧的页面。

搜索:搜索引擎 技巧 site:edu.cn

结果:已搜索有关搜索引擎 技巧 site:edu.cn的中文(简体)网页。 共约有1.08项查询结果,这是第1-10项 。 搜索用时0.05秒。

示例:上著名IT门户网站ZDNETCNET搜索一下关于搜索引擎技巧方面的资讯。

搜索:"search engine" tips site:www.zdnet.com OR site:www.cnet.com

结果:已在www.zdnet.com内搜索有关"search engine" tips OR site:www.cnet.com的网页。 共约有1,040项查询结果,这是第1-10项 。 搜索用时0.09秒。

注意,在这里Google有个小BUG已在www.zdnet.com内搜索,其实应该表述成已在www.zdnet.comwww.cnet.com内搜索

示例:搜索新浪科技频道中关于搜索引擎技巧的信息。

搜索:搜索引擎 技巧 site:tech.sina.com.cn

结果:已在tech.sina.com.cn搜索有关搜索引擎 技巧 的中文(简体)网页。 共约有11.3项查询结果,这是第1-10项 。 搜索用时0.07秒。

注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,site:将被作为一个搜索的关键字。此外,网站域名不能有http://前缀,也不能有任何/的目录后缀;网站频道则只局限于频道名.域名方式,而不能是域名/频道名方式。

3.2、在某一类文件中查找信息

filetype:Google开发的非常强大实用的一个搜索语法。也就是说,Google不仅能搜索一般的文字页面,还能对某些二进制文档进行检索。目前,Google已经能检索微软的Office文档如.xls.ppt.doc.rtfWordPerfect文档,Lotus1-2-3文档,Adobe.pdf文档,ShockWave.swf文档(Flash动画)等。其中最实用的文档搜索是PDF搜索。PDFADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。目前Google检索的PDF文档大约有2500万左右,大约占所有索引的二进制文档数量的80%。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。

示例:搜索几个资产负债表的Office文档。

搜索:资产负债表 filetype:doc OR filetype:xls OR filetype:ppt

结果:已搜索有关资产负债表 filetype:doc OR filetype:xls OR filetype:ppt的中文(简体)网页。 共约有481项查询结果,这是第1-10项 。 搜索用时0.04秒。

注意,下载的Office文件可能含有宏病毒,谨慎操作。

示例:搜索一些关于搜索引擎知识和技巧方面的PDF文档

搜索:"search engine" tips OR tutorial filetype:pdf

结果:已向英特网搜索"search engine" tips OR tutorial filetype:pdf. 共约有12,1.00项查询结果,这是第1-10项 。 搜索用时0.22秒。

我们来看其中的一个结果:

[PDF]Search Engines Tips

文档类型: PDF/Adobe Acrobat - HTML

... http://www.google.com/press/zeitgeist.html See what people are searching on at Google.com

* Search Engine Watch http://searchenginewatch.com/ Some free tips ...

www.allvertical.com/PromoKits/SearchEngineTips.pdf - 类似网页

可以看到,Google[PDF]来标记这是一个PDF的文档检索,另外,它还给出了该PDF文档的HTML版本,该HTML版保留了文档的文字内容和结构,但没有图片。

3.3、搜索的关键字包含在URL链接中

inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如MP3GALLARY等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。

示例:查找MIDI沧海一声笑

搜索:inurl:midi 沧海一声笑””

结果:已搜索有关inurl:midi "沧海一声笑"的中文(简体)网页。 共约有27项查询结果,这是第1-10项 。 搜索用时0.34秒。

注意:inurl:后面不能有空格,Google也不对URL符号如/进行搜索。例如,Google会把cgi-bin/phf中的/当成空格处理。

allinurl语法返回的网页的链接中包含所有作用关键字。这个查询的关键字只集中于网页的链接字符串。

示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是域名/cgi-bin/phf

搜索:allinurl:"cgi-bin" phf +com

结果:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有51项查询结果,这是第1-10项 。 搜索用时0.11秒。

3.4、搜索的关键字包含在网页标题中

intitleallintitle的用法类似于上面的inurlallinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。

示例:查找日本明星藤原纪香的照片集。

搜索:intitle:藤原纪香 "写真集"

结果:已搜索有关intitle:藤原纪香 "写真集"的中文(简体)网页。 共约有315项查询结果,这是第1-10项 。 搜索用时0.15秒。

3.5、搜索的关键字包含在网页的anchor)链点内

所谓,就是在同一个网页中快速切换链接点。与URLTITLE类似,Google提供了两种对anchor的检索,inanchorallincnchor。对此不作详述。

4、其他罕用语法

4.1、搜索所有链接到某个URL地址的网页

如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。而link语法就能让你迅速达到这个目的。

示例:搜索所有含指向华军软件园www.newhua.com链接的网页。

搜索:link:www.newhua.com

结果:搜索有链接到www.newhua.com的网页 。 共约有920项查询结果,这是第1-10项 。 搜索用时0.12秒。

注意:link不能与其他语法相混合操作,所以link:后面即使有空格,也将被Google忽略。另外还要说明的是,link只列出Google索引链接很小一部分,而非全部,所以如果你用Google没有搜到链到你的主页的链接,也不必灰心丧气。

除了上述功能,link语法还有其它妙用。一般说来,做友情链接的网站都有相似地方。这样,你可以通过这些友情链接,找到一大批具有相似内容的网站。比如说,你是个天文爱好者,你发现某网站非常不错,那么,可以用link语法查一下与之做链接的网站,也许可以找到更多符合你兴趣的内容。

4.2、查找与某个页面结构内容相似的页面

related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),related:wwwsina.com.cn/index.shtml我到现在也不明白这个语法有什么作用,如果有谁知道,请不吝指教。预先感谢。:)

4.3、从Google服务器上缓存页面中查询信息

cache用来搜索Google服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的网页快照功能。

其它罕用语法如infostock等不一一介绍,有兴趣的读者可以参阅Google大全。

 

 

 

 

  • 0
    点赞
  • 8
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值