用户操作
[即时聊天] [发私信] [加为好友]
大龄青年
大龄青年的公告
主人:大龄青年/hahawen
QQ:303015292
最近评论
kjb:[url=http://www.sirio.com.cn/]softgel[/url]
结肠炎治疗上我们也有非常强的历史
[url=http://www.google0808.cn/]GOOGLE左侧排名[/url]
专业的[url=http://www.zjcffy.com/]金华翻译公司[……
翻译:[url=http://www.goldenolive.net.cn]翻译公司[/url]
[url=http://www.goldenolive.net.cn]翻译[/url]
翻译公司
翻译
ff:水泵
磁力泵
多级泵
[url=http://www.hengxinbanjia.com]搬家公司[/url]
[url=http://www.hengxinbanjia.com/qqtl.htm]搬家公司[/url]
[url=http://www.hengxinbanjia.com]北京搬家公司[/url]
[url=http://www.hengxinbanjia.com/cc……
ice:Air Jordans是专业的 Air jordan推荐服务提供商,为Air jordan提供用户的推荐,Air jordan推荐利用数据技术,实时分析Air jordan用户的兴趣和要求,可以增加Air jordan提升网站的使用体验,Air jordan网站的流量.
文章分类
收藏
相册
.net技术网站
devarticles
java技术网站
Hibernate中文网(RSS)
开源项目列表
php技术网站
pear官方网站
phpbuilder
phphub.com
php官方网站
StandardPHPLibrary
trip的blog,有好多的mail文章
zend官方网站
牛人的blog
其他的技术网站
xml资源下载
友情连接
王博的Blog(RSS)
娱乐网站
bt之家
存档
软件项目交易
订阅我的博客
XML聚合  FeedSky
订阅到鲜果
订阅到Google
订阅到抓虾
订阅到BlogLines
订阅到Yahoo
订阅到GouGou
订阅到飞鸽
订阅到Rojo
订阅到newsgator
订阅到netvibes

转载 网页搜索帮助-禁止搜索引擎收录的方法[来自baidu]收藏

新一篇: 准备辞职 | 旧一篇: php自带的简易的unit函数,可以代替echo调试,但是意义好象不太大

 
 网页搜索帮助-禁止搜索引擎收录的方法
 
 

 禁止搜索引擎收录的方法

  1. 什么是robots.txt文件?
    搜索引擎通过一种程序robot(又称spider),自动访问互联网上的网页并获取网页信息。
    您可以在您的网站中创建一个纯文本文件robots.txt,在这个文件中声明该网站中不想被robot访问的部分,这样,该网站的部分或全部内容就可以不被搜索引擎收录了,或者指定搜索引擎只收录指定的内容。

  2. robots.txt文件放在哪里?
    robots.txt文件应该放在网站根目录下。举例来说,当robots访问一个网站(比如http://www.abc.com)时,首先会检查该网站中是否存在http://www.abc.com/robots.txt这个文件,如果机器人找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范围。
    网站 URL 相应的 robots.txt的 URL
    http://www.w3.org/ http://www.w3.org/robots.txt
    http://www.w3.org:80/ http://www.w3.org:80/robots.txt
    http://www.w3.org:1234/ http://www.w3.org:1234/robots.txt
    http://w3.org/ http://w3.org/robots.txt

  3. robots.txt文件的格式
    "robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示:
    "<field>:<optionalspace><value><optionalspace>"。

    在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下:

    User-agent:
      该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。

    Disallow:
      该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robot访问到。例如"Disallow:/help"对/help.html 和/help/index.html都不允许搜索引擎访问,而"Disallow:/help/"则允许robot访问/help.html,而不能访问/help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在"/robots.txt"文件中,至少要有一条Disallow记录。如果"/robots.txt"是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。

  4. robots.txt文件用法举例
    例1. 禁止所有搜索引擎访问网站的任何部分
    下载该robots.txt文件
    User-agent: *
    Disallow: /
    例2. 允许所有的robot访问 (或者也可以建一个空文件 "/robots.txt" file) User-agent: *
    Disallow:
    例3. 禁止某个搜索引擎的访问 User-agent: BadBot
    Disallow: /
    例4. 允许某个搜索引擎的访问 User-agent: baiduspider
    Disallow:


    User-agent: *
    Disallow: /
    例5.一个简单例子
      在这个例子中,该网站有三个目录对搜索引擎的访问做了限制,即搜索引擎不会访问这三个目录。
      需要注意的是对每一个目录必须分开声明,而不要写成 "Disallow: /cgi-bin/ /tmp/"。
      User-agent:后的*具有特殊的含义,代表"any robot",所以在该文件中不能有"Disallow: /tmp/*" or "Disallow:*.gif"这样的记录出现.
    User-agent: *
    Disallow: /cgi-bin/
    Disallow: /tmp/
    Disallow: /~joe/

  5. robots.txt文件参考资料
    robots.txt文件的更具体设置,请参看以下链接:
    · Web Server Administrator's Guide to the Robots Exclusion Protocol
    · HTML Author's Guide to the Robots Exclusion Protocol
    · The original 1994 protocol description, as currently deployed
    · The revised Internet-Draft specification, which is not yet completed or implemented

发表于 @ 2006年06月19日 17:42:00|评论(loading...)|编辑

新一篇: 准备辞职 | 旧一篇: php自带的简易的unit函数,可以代替echo调试,但是意义好象不太大

评论

#ensonfly 发表于2006-06-20 04:36:00  IP: 222.40.9.*
关于robots.txt,我这也有一篇。
http://ensonfly.guwancun.com/blogview.asp?logID=285
#fa 发表于2008-09-25 08:38:11  IP: 123.116.132.*
佳音特[url=http://www.jiayinte.cn]北京翻译公司[/url]是一家专业的[url=http://www.jiayinte.com]北京翻译公司[/url],凭借卓越的翻译人才实力为您提供值得信赖的翻译服务。
佳音特[url=http://www.jiayinte.net]翻译公司[/url]专业[url=http://www.jiayinte.net]翻译[/url]团队,为您提供优质[url=http://www.jiayinte.net]翻译服务[/url].
佳音特为您提供免费多语种[url=http://www.jiayinte.net/sn1]在线翻译[/url].
北京佳音特[url=http://www.jiayinte.cn]翻译公司[/url]是一家标准化大型[url=http://www.jiayinte.com]翻译公司[/url]连锁机构,[url=http://www.jiayinte.cn]翻译[/url]速度快,质量好。
[url=http://www.fwcz.net/shanghai]上海翻译公司[/url] 是一家从事专业[url=http://www.jiayinte.net/fygs/]翻译[/url]服务的机构,[url=http://www.jiayinte.cn]翻译公司[/url]提供更加准确、快捷、高效的[url=http://www.jiayinte.com]翻译[/url]服务.
美伦[url=http://www.czfw.net/education]少儿英语[/url]坚持100%外教授课,坚持自然主义母语教学法,致力于让每个非英语国家的[url=http://www.czfw.net/education]英语学习[/url]者获得第二母语。
美伦(国际)[url=http://www.meilun88.com]翻译公司[/url]是经北京市工商局正式注册的专业性大型[url=http://www.meilun88.com]北京翻译公司[/url]。
北京佳音特[url=http://www.czfw.net]同声传译[/url] [url=http://www.jiayinte.com]翻译公司[/url]为客户提供专业的[url=http://www.czfw.net]同声翻译[/url]、[url=http://www.czfw.net]同传[/url]译员派遣、会议设备租赁等服务。
北京佳音特[url=http://www.jiayinte.net/fygs/]翻译公司[/url]是中国翻译行业规范化和标准化的[url=http://www.jiayinte.net/fygs/]翻译公司[/url]典范. [url=http://www.jiayinte.net/fygs/]翻译[/url]领域涵盖157个行业, [url=http://www.jiayinte.net/fygs/]翻译[/url]语言种类70多个.擅长[url=http://www.jiayinte.net/fygs/]同传翻译[/url],加急标书.
#ice 发表于2008-10-04 23:42:15  IP: 119.146.204.*
Air Jordans是专业的 Air jordan推荐服务提供商,为Air jordan提供用户的推荐,Air jordan推荐利用数据技术,实时分析Air jordan用户的兴趣和要求,可以增加Air jordan提升网站的使用体验,Air jordan网站的流量.
发表评论  


登录
Csdn Blog version 3.1a
Copyright © 大龄青年