GOOGLE搜索
 
一,GOOGLE简介

Google([url]www.google.com[/url])是一个搜索引擎,由两个斯坦福大学博士生Larry Page与Sergey Brin于1998年9月发明,Google Inc. 于1999年创立。2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得30多项业界大奖。

二,GOOGLE特色

GOOGLE支持多达132种语言,包括简体中文和繁体中文;
GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;
GOOGLE速度极快,据说有8000多台服务器,200多条T3级宽带;

GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;
GOOGLE的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;
GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;
GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。

三,基本搜索:+,-,OR

GOOGLE无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。

示例:搜索所有包含关键词“易筋经”和“吸星**”的中文网页
搜索:“易筋经 吸星**”
结果:已搜索有关易筋经 吸星**的中文(简体)网页。共约有726项查询结果,这是第1-10项。搜索用时0.13秒。

注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。

GOOGLE用减号“-”表示逻辑“非”操作。

示例:搜索所有包含“易筋经”而不含“吸星**”的中文网页
搜索:“易筋经 -吸星**”
结果:已搜索有关易筋经 -吸星**的中文(简体)网页。共约有5,440项查询结果,这是第1-10项。搜索用时0.13秒。

注意:这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经 - 吸星**”,搜索引擎将视为逻辑“与”操作,中间的“-”被忽略。

GOOGLE用大写的“OR”表示逻辑“或”操作。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。

示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。
搜索:“britney OR beatles”
结果:已搜索有关britney OR beatles的中文(简体)网页。共约有14,600项查询结果,这是第1-10项。搜索用时0.08秒。
搜索:“布兰妮 OR 披头士”
结果:找不到和您的查询-布兰妮 OR 披头士-相符的网页。

注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。

“+”和“-”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。

例:查阅天龙八部具体是哪八部。

分析:如果光用“天龙八部”做关键字,搜索结果有26,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。

1,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部 阿修罗”。

2,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为1,010项,可以迅速找到需要的资料,“天龙八部 佛教 -金庸”。

四,辅助搜索:通配符、大小写、句子、忽略字符以及强制搜索

GOOGLE不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。

GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。

GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。


示例:搜索包含“long, long ago”字串的页面。
搜索:“"long, long ago"”
结果:已向英特网搜索"long, long ago". 共约有28,300项查询结果,这是第1-10项。搜索用时0.28秒。

注意:和搜索英文关键字串不同的是,GOOGLE对中文字串的处理并不十分完善。比如,搜索“"啊,我的太阳"”,我们希望结果中含有这个句子,事实并非如此。查询的很多结果,“啊”、“我的”、“太阳”等词语是完全分开的,但又不是“啊 我的 太阳”这样的与查询。显然,GOOGLE对中文的支持尚有欠缺之处。

GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“+”。

示例:搜索包含“Who am I ?”的网页。如果用“"who am i ?"”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。
搜索:“"+who +am +i"”
结果:已向英特网搜索"+who +am +i". 共约有362,000项查询结果,这是第1-10项。搜索用时0.30秒。

注意:英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。
 
 
高级搜索:site,link,inurl,allinurl,intitle,allintitle

    “site” 表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。

示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。
搜索:“金庸 site:edu.cn”
结果:已搜索有关金庸 site:edu.cn的中文(简体)网页。共约有2,680项查询结果,这是第1-10项 。搜索用时0.31秒。
示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,
搜索:“金庸 古龙 siteina.com.cn”
结果:已在sina.com.cn搜索有关金庸 古龙的中文(简体)网页。共约有869项查询结果,这是第1-10项。搜索用时0.34秒。

注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸 site:edu.sina.com.cn/1/”的语法是错误的

   “link” 语法返回所有链接到某个URL地址的网页。

示例:搜索所有含指向华军软件园“[url]www.newhua.com[/url]”链接的网页。
搜索:“link:[url]www.newhua.com[/url]”
结果:搜索有链接到[url]www.newhua.com[/url]的网页。共约有695项查询结果,这是第1-10项。搜索用时0.23秒。

注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。

   "inurl"语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中 。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。

示例:查找MIDI曲“沧海一声笑”。
搜索:“inurl:midi 沧海一声笑”
结果:已搜索有关inurl:midi 沧海一声笑的中文(简体)网页。共约有14项查询结果,这是第1-10项。搜索用时0.01秒。

示例:查找微软网站上关于windows2000的安全课题资料。
搜索:“inurlecurity windows2000 site:microsoft.com”
结果:已在microsoft.com内搜索有关 inurlecurity windows2000的网页。共约有198项查询结果,这是第1-10项。搜索用时0.37秒。

注意:“inurl:”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。GOOGLE对“cgi-bin/phf”中的“/”当成空格处理

"allinurl"语法返回的网页的链接中包含所有查询关键字。这个查询的对象只集中于网页的链接字符串。

示例:查找可能具有PHF安全漏洞的公司网站。通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。
语法:“allinurl:"cgi-bin" phf +com”
搜索:已向英特网搜索allinurl:"cgi-bin" phf +com. 共约有40项查询结果,这是第1-10项。搜索用时0.06秒。

allintitle和intitle的用法类似于上面的allinurl和inurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。网页标题,就是HTML标记语言title中之间的部分。网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。因此,只查询标题栏,通常也可以找到高相关率的专题页面。

示例:查找日本明星藤原纪香的照片集。
搜索:“intitle:藤原纪香 写真”
结果:已搜索有关intitle:藤原纪香 写真的中文(简体)网页。共约有284项查询结果,这是第1-10项。搜索用时0.03秒。

GOOGLE的罕用高级搜索语法:related,cache,info

related用来搜索结构内容方面相似的网页。例:搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:[url]www.sina.com.cn/index.shtml[/url]”。

cache用来搜索GOOGLE服务器上某页面的缓存,这个功能同“网页快照”,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。

info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。

示例:查找和新浪首页相关的一些资讯。
搜索:“infwww.sina.com.cn”
结果:有关[url]www.sina.com.cn[/url]的网页信息。
新浪首页
北京站 上海站 广东站. ... 游戏世界, |, 影音娱乐, |, Club缘, |, 男
人女人, |, 论坛聊天, |, 时尚潮流, |, 文教育儿, |, 车行天下, |,
软件下载. ...
Google 提供这个网址的信息:
查看Google网页快照里[url]www.sina.com.cn[/url]的存档
寻找和[url]www.sina.com.cn[/url]类似的网页
寻找网页有链接到[url]www.sina.com.cn[/url]
寻找网页包含有`[url]www.sina.com.cn[/url]`
 
六,其他重要功能

目录服务

如果不想搜索网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录“[url]http://directory.google.com/[/url]”,中文目录是“[url]http://directory.google.com/Top/World/Chinese_Simplified/[/url]”。不过由于GOOGLE的目录由志愿者服务,而GOOGLE在国内名气相对比较小,因此中文目录下收录站点很少。

工具条

为了方便搜索者,GOOGLE提供了工具条,集成于浏览器中,用户无需打开GOOGLE主页就可以在工具条内输入关键字进行搜索。此外,工具条还提供了其他许多功能,如显示页面PageRank等。最方便的一点在于用户可以快捷的在GOOGLE主页、目录服务、新闻组搜索、高级搜索和搜索设定之间切换。欲安装GOOGLE的工具条,可以访问“[url]http://toolbar.google.com/[/url]”,按页面提示可以自动下载并安装。

新闻组(USENET)搜索

新闻组中有大量的有价值信息,DEJA一直是新闻组搜索引擎中的佼佼者。2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。

输入“[url]http://groups.google.com/[/url]”后,便进入GOOGLE新闻组界面。可惜现在还没有中文界面。因为新闻组中的帖子实在是多,所以我点击“Advaced Groups Search”进入高级搜索界面[url]http://groups.google.com/advanced_group_search[/url]。新闻组高级搜索界面提供对关键字、新闻组、主题、作者、帖子序号、语言和发布日期的条件搜索。其中作者项指作者发帖所用的唯一识别号电子信箱。比如要在alt.chinese.text内搜索著名老牌网络写手图雅的帖子,可以用下列指令“group:alt.chinese.text author:tuya@ccmail.uoregon.edu”。不过一般而言,我更推荐使用图形搜索界面,方便而且直观。

搜索结果翻译

曾经为那些你不懂的法文、西班牙文页面烦恼么?现在,GOOGLE支持一项搜索结果翻译功能,可以把非英文的搜索结果翻译成英文!!虽然目前只支持有限的拉丁语、法语、西班牙语、德语和葡萄牙文,但是我不得不承认,这是个伟大的改进。

不过,目前只能在英文状态GOOGLE下实现这个功能。进入GOOGLE的设置页面,[url]http://www.google.com/preferences[/url],有一个“BETA: Enable translation of search results into your interface language. ”的选项,把它选中,就OK了。

搜索结果过滤

网络上的成人内容浩如烟海,而且很多站点具有欺骗或者其他不良企图,浏览者很容易掉入其中的陷阱。为此,GOOGLE新设立了成人内容过滤功能,见GOOGLE的设置页面,[url]http://www.google.com/preferences[/url],最底下有一个选项SafeSearch Filtering。不过,中文状态下的GOOGLE尚没有这个功能。

PDF文档搜索

我对GOOGLE尤其欣赏的一点就是它提供对PDF文档内文的检索。目前GOOGLE检索的PDF文档大约有2500万左右。这真是太美妙了。PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。

示例:搜索关于电子商务(ECOMMERCE)的PDF文档。
搜索:“inurldf ecommerce”
结果:已向英特网搜索inurldf ecommerce. 共约有19,200项查询结果,这是第1-10项。搜索用时0.11秒。

下面是某项搜索结果:

[PDF] [url]www.usi.net/pdf/outsoucing-ecommerce.pdf[/url]
Outsourcing Electronic Commerce Business Case White Paper By: John P. Sahlin, Product
Marketing Professonial (PMP) Implementation Manager, Web Engineering ...
一般文字档 - 类似网页

可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。当然,PDF原有的图片以及格式是没有了。

图像文档搜索

GOOGLE提供了Internet上图像文件的搜索功能!!目前该功能尚在B测试阶段,但已经非常好用。访问地址是“p_w_picpaths.google.com”。你可以在关键字栏位内输入描述图像内容的关键字,如“britney spears”,也可以输入描述图像质量或者其他属性的关键字,如“high quality”。
GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。屏幕右上角有一个“Remove Frame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。GOOGLE还提供了对成人内容图像的限制功能,可以让搜索者免受不必要的骚扰。

不过,非常遗憾的是,图像搜索功能还不支持中文。
 
七,搜索技巧杂谈

关键词的选择在搜索中起到决定性的作用,所有搜索技巧中,关键词选择是最基本也是最有效的。

例一:查找《×××缘》一书中淑士国酒保的酸话原文。

分析:如果按照一般的思路,找某部小说中的具体段落,就需要用搜索引擎先找到这本书,然后再翻到该段落。这样做当然可以,但是效率很低。如果了解目标信息的构成,用一些目标信息所特有的字词,可以非常迅速的查到所需要的资料。也就是说,高效率的搜索关键字不一定就是目标信息的主题。在上面的例子中,酒保谈到酒的浓淡与贵贱的关系时,之乎者也横飞。因此,可以用特定的词语一下子找到目标资料。

搜索:“酒 贵 贱 之”,OK,找到的第一条信息就是×××缘的这一段落:“先生听者:今以酒醋论之,酒价贱之,醋价贵之。因何贱之?为甚贵之?真所分之,在其味之。酒昧淡之,故而贱之;醋味厚之,所以贵之。...”

以上的关键字选择技巧可以谓之“特定词法”。

例二:“黄花闺女”一词中“黄花”是什么意思。

分析:“黄花闺女”是一个约定的俗语,如果只用“黄花闺女 黄花”做关键词,搜索结果将浩如烟海,没什么价值,因此必须要加更多的关键词,约束搜索结果。选择什么关键词好呢?备选的有“意思”、“含义”、“来历”、“由来”、“典故”、“出典”、“渊源”等,可以猜到的是,类似的资料,应该包含在一些民俗介绍性的文字里,所以用诸如“来历”、“由来”、“出典”等词汇的概率更高一些。

搜索:“黄花闺女 黄花 由来”,查到“黄花”原来出典于《太平御览》,与南朝的寿阳公主相关。如果想获得第一手资料,那就可以用“太平御览 寿阳公主”做搜索了。

以上的关键字选择技巧可以谓之“近义词法”。

例三:刘德华同志的胸围是多少。

分析:首先声明,这是某个MM要我做的搜索,我把它作为搜索案例而已,没其他的意思。非常直接的搜索是,“刘德华 胸围”,但事实上,这么搜索出来的结果,尽是一些诸如“刘德华取笑莫文蔚胸围太小”之类的八卦新闻,无法快速得到所需要的资料。可以想到的是,需要的资料应该包含在刘德华的全面介绍性文字中,除了胸围,应该还包括他的身高,体重,生日等一系列相关信息。OK,这样就可以进一步的增加其他约束性关键词以缩小搜索范围。

搜索:“刘德华 胸围 身高”,没有料到的情况发生了,网上炙手可热的痞子蔡《第一次亲密接触》里居然含有这样关键字,阿泰“改编自刘德华《忘情水》的变态歪歌”、“用身高体重三围和生日来加以编号”。好办,把这部小说去掉,“刘德华 胸围 身高 -阿泰”,OK,结果出来了,华仔胸围84cm。说明一下,为什么用“阿泰”而不用“第一次亲密接触”呢?这是因为小说的名字被转载的时候可能有变动,但里面角色的名字是不会变的。

以上的关键字选择技巧可以谓之“相关词法”。

其他常用搜索个案

例一:找人

分析:一个人在网上揭示的资料通常有:姓名,网名,性别,年龄,毕业学校,工作单位,外号,住址,电话,信箱,BP,手机号码,ICQ号,OICQ号等等。所以,如果你要了解一下你多年没见过的同学,那不妨用上述信息做关键字进行查询,也许会有大的收获。

例二:找软件

分析一:最简单的搜索当然就是直接以软件名称以及版本号为关键字查询。但是,仅仅有软件名称和目标网站,显然还不行,因为搜索到的可能是软件的相关新闻。应该再增加一个关键字。考虑到下载页面上常有“点击此处下载”或者“download”的提示语,因此,可以增加“下载”或者“download”为关键字。
搜索:“winzip 8.0 下载”
结果:已搜索有关winzip 8.0 下载的中文(简体)网页。共约有6,670项查询结果,这是第1-10项。搜索用时0.22秒。

分析二:很多网站设有专门的下载目录,而且就命名为“download”,因此,可以用INURL语法直接搜索这些下载目录。
搜索:“winzip 8.0 inurlownload”
结果:已搜索有关winzip 8.0 inurlownload的中文(简体)网页。共约有358项查询结果,这是第1-10项。搜索用时0.44秒。

在互联网上随意的下载软件是不安全的,因为供下载的软件有可能带有病毒或者捆绑了***,所以,对下载网站作一个限定,是一个稳妥的思路。可以用SITE语法达到这个目的。

共享软件下载完之后,使用的时候,软件总跳出警示框,或者软件的功能受到一定限制。由于中国的网民多是穷棒子,所以应该再找一个注册码。找注册码,除了软件的名称和版本号外,还需要有诸如“serial number”、“sn”、“序列号”等关键字。现在,来搜索一下winzip8.0的注册码。
搜索:“winzip 8.0 sn”
结果:已向英特网搜索winzip 8.0 sn. 共约有777项查询结果,这是第1-10项。搜索用时0.30秒。

例三:找图片

除了GOOGLE提供的专门图片搜索功能,还可以组合使用一些搜索语法,达到图片搜索之目的。

分析一:专门的图片集合,提供图片的网站通常会把图片放在某个专门目录下,如“gallary”、“album”、“photo”、“p_w_picpath”等。这样就可以使用INURL语法迅速找到这类目录。现在,试着找找小甜甜布兰妮的照片集。
搜索:“"britney spears" inurlhoto”
结果:已向英特网搜索"britney spears" inurlhoto. 共约有2,720项查询结果,这是第1-10项。搜索用时0.23秒。

分析二:提供图片集合的网页,在标题栏内通常会注明,这是谁谁的图片集合。于是就可以用INTITLE语法找到这类网页。
搜索:“intitle:"britney spears" picture”
结果:已向英特网搜索intitle:"britney spears" picture. 共约有317项查询结果,这是第1-10项。搜索用时0.40秒。

分析三:明星的FANS通常会申请免费个人主页来存放他们偶像的靓照。于是用SITE语法指定某免费主页提供站点,是个迅速找到图片的好办法。
搜索:“"britney spears" site:geocities.com”
结果:已在geocities.com内搜索有关"britney spears"的网页。共约有5,020项查询结果,这是第1-10项。搜索用时0.47秒。

例四:找MP3

分析一:提供MP3的网站,通常会建立一个叫做MP3的目录,目录底下分门别类的存放各种MP3乐曲。所以,可以用INURL语法迅速找到这类目录。现在用这个办法找找老歌“say you say me”。
搜索:“"say you say me" inurl:mp3”
结果:已向英特网搜索inurl:mp3 "say you say me". 共约有155项查询结果,这是第1-10项。搜索用时0.17秒。

分析二:也可以通过网页标题,找到这类提供MP3的网页。
搜索:“"say you say me" intitle:mp3”
结果:已向英特网搜索"say you say me" intitle:mp3. 共约有178项查询结果,这是第1-10项。搜索用时0.73秒。

当然,如果你知道某个网站的下载速度快,而且乐曲全,就可以用SITE语法先到该网站上看看有没有目标乐曲。

例五:找书

分析一:对我而言,常访问的电子图书馆类网站就那么几个,比如文艺类的“[url]www.shuku.net[/url]”。于是可以用SITE语法很简单的找到某本书(如果该网站上有的话)。比如,“旧唐书 sitehuku.net”,就可以马上找到该书。如果没有,通常别的网站上也很难找到。因此,找书的关键,是你了解一大批著名的图书馆网站。

分析二:我上面介绍的第一项关键字选择技巧特定词法,对于迅速找到某书或者文章也是极其有用的,当然,这得建立在你已经读过该书,对书的内容有印象的基础上。比如如果了解堂吉诃德一书战风车的大致内容,就可以用“吉诃德 风车 桑乔”迅速找到该书。

九,GOOGLE搜索FAQ

Q:如何全面的了解google.com?
A:查看网站相关页面“[url]http://www.google.com/about.html[/url]”。

Q:如何切换google.com的初始语言界面?
A:点击搜索栏右边的“使用偏好”(Preferences),选择“界面语言”(Interface Language)中你期望的语言,点击最下面的“设定使用偏好”(Save Preferences)按钮。需要提醒的是,GOOGLE用cookie记录这个偏好,所以如果你把浏览器的cookie功能关掉,就无法进行设定。

Q:如何设定每页搜索结果显示数量?
A:同上,进入使用偏好,在该页的“查看结果”(Number of Results)选择显示结果数,数目越大,显示结果需要的时间越长,默认是10项。

Q:搜索到的链接无法打开怎么办?
A:链接无法打开的原因很多,比如网站当机,或者ISP过滤等,可以点击GOOGLE的“网页快照”查看在GOOGLE服务器上的网页缓存。

Q:打开搜索结果的链接,可是该页面太大,很难找到一下子找到目的资料怎么办?
A:直接打开“网页快照”,GOOGLE会把关键词用不同颜色标记出来,很容易找到.
 
 
很多时候,我们希望知道GOOGLE什么时候更新,比如

自己的网站刚刚增加了很多页面,希望知道GOOGLE下次更新会索引多少页
刚刚和几个不错的网站做了连接,希望知道GOOGLE下次更新后PR会不会长
如果要把网站的HTML页面重新生成,应该避开GOOGLE更新的时候,因为那样可能因为过多的404而导致GOOGLE删除页面
……
如何知道GOOGLE在什么时候更新呢?

GOOGLE研究者们发现了一个很简单的办法,就是查看GOOGLE的几个镜像站点是否相同,因为在GOOGLE更新期间,他总是将www2.google.com或者www3.google.com作为更新测试站点,在这期间,后两个站点中索引的页面数量和主站点将会不同。比如当我们从

[url]www.google.com[/url] / www2.google.com / www3.google.com

三个网站搜索同一个关键词,得到的结果的数量不相同,这就说明GOOGLE正在更新。

GOOGLE这种大规模的更新在国外被称为GOOGLE DANCE(狗狗跳舞),有一个专门协助我们检查他是否正在跳舞的网站

[url]http://www.google-dance-tool.com[/url]

这个网站提供一个工具,通过这个工具,我们只需要输入一个关键词然后点击一个按钮,就可以看到GOOGLE三个镜像站点的搜索结果,很方便我们对比。

通过这个办法,我知道了上次GOOGLE更新是在一月底二月初,我和几个朋友目睹了他们各自网站被GOOGLE索引的页面的数目的变化。昨天晚上检查了一下,发现在三个镜像站点上搜索“统计”、“下载”这些关键词的结果不相同,说明GOOGLE又开始活跃了。   
 
Google 的特殊功能

查找 PDF 文件

除一般网页外,Google 现在还可以查找 Adobe 的可移植文档格式 (PDF) 文件。虽然 PDF 文件不象 HTML 文件那样多,但这些文件通常会包含一些别处没有的重要资料。

如果某个搜索结果是 PDF 文件而不是网页,它的标题前面会出现以蓝色字体标明的 [PDF]。这样,用户就知道需要启动 Acrobat Reader 程序才能浏览该文件。单击 [PDF] 右侧的标题链接就可以访问这个 PDF 文档。(如果您的计算机上没有 Adobe Acrobat,Google 将带您进入一个可以免费下载该程序的网页。)

对于 PDF 文件,常见的“网页快照”将被“文本文件”所替代。文本文件是 PDF 文档中的纯文本内容,不带任何格式。

如果您只想查找 PDF 文件,而不要一般网页,只需在搜索关键词后加上 filetype:pdf 就可以了。


--------------------------------------------------------------------------------

网页快照

Google 在访问网站时,会将看过的网页复制一份网页快照,以备在找不到原来的网页时使用。单击“网页快照”时,您将看到 Google 将该网页编入索引时的页面。Google 依据这些快照来分析网页是否符合您的需求。

在显示网页快照时,其顶部有一个标题,用来提醒您这不是实际的网页。符合搜索条件的词语在网页快照上突出显示,便于您快速查找所需的相关资料。

尚未编入索引的网站没有“网页快照”,另外,如果网站的所有者要求 Google 删除其快照,这些网站也没有“网页快照”。

--------------------------------------------------------------------------------

类似网页

单击“类似网页”时,Google 侦察兵便开始寻找与这一网页相关的网页。

Google 侦察兵可以“一兵多用”。如果您对某一网站的内容很感兴趣,但又嫌资料不够,Google 侦察兵会帮您找到其他有类似资料的网站;如果您在寻找产品信息,Google 侦察兵会为您提供相关信息,供您比较,使您尽可货比三家;如果您在某一领域做学问,Google 侦察兵会成为您的助手,帮您快速找到大量资料。

Google 侦察兵已为成千上万的网页找到了类似网页,但网页越有个性,能找到的类似网页就越少。例如,您独树一帜的个人主页就很难有类似网页。此外,如果公司有多个网址(如 google.com 和 [url]www.google.com[/url]),Google 侦察兵为各个网址找到的类似网页可能会有所不同。但这种情况实属罕见,Google 侦察兵将是您出色的助手。

--------------------------------------------------------------------------------

按链接搜索

有一些词后面加上冒号对 Google 具有特殊的含义。其中的一个词是“link:”。查询 link: 显示所有指向该网址的网页。例如,“link:[url]www.google.com[/url]”将找出所有指向 Google 主页的网页。不能将 link: 搜索与普通关键词搜索结合使用。

--------------------------------------------------------------------------------


指定网域

有一些词后面加上冒号对 Google 有特殊的含义。其中的一个词是“site:”。要在某个特定的域或站点中进行搜索,可以在 Google 搜索框中输入“site:xxxxx.com”。

--------------------------------------------------------------------------------


手气不错

按下“手气不错™”按钮将自动进入 Google 查询到的第一个网页。您将完全看不到其它的搜索结果。使用“手气不错”进行搜索表示用于搜索网页的时间较少而用于检查网页的时间较多。

例如,要查找 Stanford 大学的主页,只需在搜索字段中输入“Stanford”,然后单击“手气不错”按钮。Google 将直接带您进入 Stanford 大学的官方主页 [url]www.stanford.edu[/url]。

您的手气如何?

--------------------------------------------------------------------------------

错别字改正

Google 的错别字改正软件系统会对输入的关键词进行自动扫描, 检查有没有错别字。如果发现用其他字词搜索可能会有更好的结果,它能提供相应提示来帮助纠正可能有的错别字。例如,搜索“互连网”,Google 会自动提示 “您是不是要找:互联网”。如果您点击 “互联网”,Google 将以“互联网”作为关键词进行搜索。

因为Google 的错别字改正软件系统是建立在互联网上所能找到的所有词条之上,它能够提示常用人名及地名的最常见的书写方式,这是一般的错别字改正软件所不及的。

--------------------------------------------------------------------------------

中英文字典

Google 给中英文单词互译带来了极大的方便。您只需输入一个关键词(“翻译”,“fy” 和“FY” 任选其一)和要查的中 (英) 文单词,Google返回的网上字典链接让您即刻便可知道您要查的词的英文(或中文)翻译。如果是中译英,Google还会直接显示您要查的单词的英文释义。

--------------------------------------------------------------------------------

天气查询

用Google 查询中国城市地区的天气和天气预报,只需输入一个关键词(“天气”,“tq” 或“TQ” 任选其一)和您要查询的城市地区名称即可。Google返回的网站链接会带给您最新的当地天气状况和天气预报。


--------------------------------------------------------------------------------

股票查询

用Google 查询股票价格和股市行情,非常简洁方便。您只需输入一个关键词(“股票”,“gp” 和“GP” 任选其一)和想查询的股票证券名称或是其六位数代码,Google就会返回其他链接让您只要一次点击便能得到有关股票证券的详尽资料。

--------------------------------------------------------------------------------

邮编区号

用Google 查询邮政编码或长途电话区号,您只需输入关键词(“邮编”,“yb” 和“YB” 任选其一;“区号”, “qh” 和“QH” 任选其一)和要查的城市地名或邮政编码或电话区号即可。Google 会为您提供相关的所有信息,包括所在地的省市名称,邮政编码及长途电话区号。
--------------------------------------------------------------------------------



手机号码

用Google 查询手机电话号码归属地,您只需直接输入要查的号码即可(不需要任何关键词)。Google 能自动识别以13开头的11位数字为手机号码而返回相关的网站链接,让您即刻便知道答案。


目前 Google 简体中文界面的股票,天气,邮编区号和手机号码查询功能仅适用于中国大陆地区。Google与所选的特殊搜索链接网站没有从属关系,如果您认为有其他好的网站,欢迎您写电子邮件向我们推荐,地址:[email]chinese_s@google.com[/email].
 
 
 
也许前人已经谈过了,这只是作站点这些时间得出的一些小小的经验,希望对大家有帮助。

[url]http://www.cncms.org[/url]
本站有2个主要的关键词,一个是”内容管理“,一个是”xplus“,目前”内容管理“这个关键词,在google,本站排列第一位,"xplus"这个英文关键词,本站占据9,10位。

对于google的优化主要在2方面,一个是meta关键词,一个就是首页的内容

[url]www.cncms.org[/url]的meta部分如下
<meta name="keywords" content="news, technology, headlines, xplus, software, download, downloads, free, community,  php, survey, poll, polls, comments, portal, mysql, sql, database, databases, web site, weblog, guru, module, modules, theme, themes, cms, content management,内容管理,内容管理系统,全站,整站,企业建站" >
<meta name="description" content="xplus is a web content manage system" >
<meta name="rating" content="general" >
<meta name="author" content="peter,muyu" >
<meta name="copyright" content="Copyright  2002-2003" >
<meta name="generator" content="XPLUS" >



而首页出现xplus 这个词36次,”内容管理“这个词16次。cncms.org的google rank一直是5分,不高也不低,这个分值应该与这个地址在互联网上被链接的次数来的,就是说你的友情链接够多,而且链接这个地址的站点的google rank分值越高,则这个url的google rank分值就越高。过段时间可以做个测试,我将cncms提交到hotscripts去,hotscripts的google rank一直是8-9分,估计用不了多久,cncms的google rank可以提升到6分。这个意思就是说,大家要削尖脑袋和大站作链接,越多越好,分数低的站点会拉低你的分数的。

还有一个有意思的地方,google好像比较喜欢org站点,对com和net的好感不高。cncms.org还有一个域名[url]www.ecmsys.com[/url]就基本上在google查询不到。这个和链接数有很大的关系,当然和.com也有小小的关系。

google dance的规则基本每周都在变,但是基本的几个方式还是一直保留的,作弊是不可取的,当心google把你给禁了,苦都哭不出来。


 
 
 
 
 
 
 
 
 
google hacking其实并算不上什么新东西,当时并没有重视这种技术,认为webshell什么的,并无太大实际用途。google hacking其实并非如此简单...

  google hacking的简单实现

  使用google中的一些语法可以提供给我们更多的信息(当然也提供给那些习惯***的人更多他们所想要的),下面就来介绍一些常用的语法。

  intext:

  这个就是把网页中的正文内容中的某个字符做为搜索条件,例如在google里输入:intext:动网.将返回所有在网页正文部分包含"动网"的网页

  .allintext:

  使用方法和intext类似.  

  intitle:

  和上面那个intext差不多,搜索网页标题中是否有我们所要找的字符,例如搜索:intitle:安全天使.将返回所有网页标题中包含"安全天使"的网页。同理allintitle:也同intitle类似。

  cache:

  搜索google里关于某些内容的缓存,有时候也许能找到一些好东西哦.

  define:

  搜索某个词语的定义,搜索:define:hacker,将返回关于hacker的定义.

  filetype:

  这个我要重点推荐一下,无论是撒网式***还是我们后面要说的对特?勘杲?行畔⑹占?夹枰?玫秸飧?搜索指定类型的文件.例如输入:filetype:doc.将返回所有以doc结尾的文件URL.当然如果你找.bak、.mdb或.inc也是可以的,获得的信息也许会更丰富

  info:

  查找指定站点的一些基本信息.

  inurl:

  搜索我们指定的字符是否存在于URL中.例如输入:inurl:admin,将返回N个类似于这样的连接:[url]http://www.xxx.com/xxx/admin[/url],用来找管理员登陆的URL不错.allinurl也同inurl类似,可指定多个字符.

  link:

  例如搜索:inurl:[url]www.4ngel.net[/url]可以返回所有和[url]www.4ngel.net[/url]做了链接的URL.

  site:

  这个也很有用,例如:site:[url]www.4ngel.net.[/url]将返回所有和4ngel.net这个站有关的URL.