使用robots.txt控制搜索引擎抓取

搜索引擎数据库中的所有网页,都是由Robot程序自动抓取收录的。但我们网站上总会有部分私密性数据不希望被搜索引擎抓取,这时候,就需要robots.txt。

  robots.txt 是一个标准文档,意在阻止搜索引擎的Spider(蜘蛛)从您的 Web 服务器下载某些或全部信息,控制Spider的搜索范围。robots.txt的设置很简单,只要用记事本或其他文本编辑器,依照自己的网站需求,设定一 系列选项,然后将其上传到网站根目录即可。robots.txt的设置如下:

User-agent: 搜索引擎的spider代号
Disallow: 输入数据夹或文件名的路径

  如设定所有的spider都能够搜索及抓取整个网站。

User-agent: *
Disallow:

  如拒绝Google搜索及抓取整个网站,但允许其它的

User-agent: Googlebot
Disallow:

  如拒绝所有的Spider

User-agent: *
Disallow: /

  如拒绝所有的Spider搜索及抓取protect目录及seo目录下abc.html文件

User-agent: *
Disallow: /protect/
Disallow: /seo/abc.html

  如拒绝google搜索及抓取protect目录及seo目录下abc.html文件,但允许其他的

User-agent: Googlebot
Disallow: /protect/
Disallow: /seo/abc.html

  很简单吧?另有一点请记住,搜索引擎不会立即对robots.txt 文件所作的更改作出反应,必须等到搜索引擎下一次读取该文件。这段时间,依搜索引擎及具体网站情况,从几小时到几天不等。


 

 

 

 

你好,我有一个关于robots.txt的问题,希望得到解答。

我想禁止所有的robot访问我网站根目录的go.php文件,一般这些文件是 go.php?q=…,这个文件的作用是根据q=的参数,从我的网站转到其他网站去。

我的robots.txt文件是如下所写:

User-agent: *
Disallow: /go.php

我的这个文件是建站之时就存在的,是Windows下的文本文件。但是只有yahoo搜索引擎没有收录go.php,Google和MSN都收录和很多go.php?q=…的文件。按照道理来说,这些大的搜索引擎都会完全遵守robots.txt文件。

我在另一个网站下将此文件设置成了UNIX格式,但是依然如此,连yahoo也收录了一些这样的文件。

究竟什么原因造成的,我苦思不解。

 

 

 

 

 

老实说,对于这个问题,本人以前未遇到过,不过,有这么几种解决思路:
1、使用通配符,类似如下的方式:
  User-agent: Googlebot
  Disallow: go.php*?
 这种方式,至少对Google可行(Google支持通配符),其他搜索引擎是否支持则不得而知。
2、将go.php放入单独的子目录,如“/go/”,然后:
  Disallow: /go/
  这样应该能禁止收录该文件及动态产生的页面。(个人臆想,未经过测试)
3、更稳妥的办法,类似这样的情况干么非得让robots.txt实现,直接在go.php中使用Meta Tag不是更简单么?
  在Head部分加入:
   <meta name=”robots” content=”noindex,nofollow”>
  其中的“nofollow”视情况决定是否加入

 

 

 

 

 

 

 相关知识点:html  meta_百度百科

 

 

 

SEO搜索引擎优化.txt一定要学会SEO! 欢迎来到SEOWHY、 SEO论坛 站长们说:学SEO就上SEOWHY! SEOWHY第四批SEO培训计划 公司企业:进入SEO人才库、了解企业网络营销SEO培训计划 欢迎来电咨询:0755-84875213 夫唯(上班时间) 什么是SEO,SEO是什么意思? SEO的文意思是搜索引擎优化。通过总结搜索引擎的排名规律,对网站进行合理优化,使你的网站在百度和Google的排名提高,让搜索引擎给你带来客户。什么是SEO优化?开始吧: SEOWHY产品和服务 SEO基础指南 www.seowhy.com,系统的SEO优化教程,SEO新手可以快速入门。 SEO答疑论坛 www.seowhy.com/bbs,在提问、解答深刻理解SEO优化知识。 友情链接SEO空间 www.seowhy.com/sns,上千位站长提交网站,按类别和PR值交换友情链接。 SEO人才库 www.seowhy.com/rencai,提供关键词优化服务或SEO应聘的平台。 九点咨询 www.seowhy.com/9dian,为企业提供SEO咨询顾问和SEO培训服务。 我们已系统提供全面新手入门教程,请认真对待以下内容! SEO基本概念: 什么是死链接? 什么是错误链接? 什么叫向链接? 如何查看向链接更准确? black hat-黑冒 Sandbox-沙盒效应 Alexa排名是什么? ALT-代替属性 link和domain的区别 什么是长尾关键词? 目标关键词是什么意思? 如何进行关键词分析? 关键词密度多少比较好? 写网页内容需要注意些什么? 几大搜索引擎的网站登录入口 做网站该注意哪些基本要素? SEO一般有哪些步骤或环节? 网站被百度和Google封了,怎么办?
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值