设置搜索引擎不收录的方法

    有的时候,站长们希望自己网站内的某些内容不要被搜索引擎的蜘蛛爬取,设置搜索引擎不收录,原因有以下几点:第一,蜘蛛的抓取会增加服务器的负担,导致一部分用户体验不佳;第二,某一些信息需要权限才可以查看;第三,某一些网页保护隐私信息,站长不希望其被搜索引擎收录而让某些用户访问到........

     这个时候有以下的方法来设置:

     第一种方法最为常见,就是设置robots.txt文件,这个文件一般是放在网站的根目录下面,它里面有两个主要字段,分别是User-agent和Disallow。User-agent是设定哪些搜索引擎的蜘蛛能够爬取,每一个搜索引擎都有自己的一个名字,如百度的蜘蛛叫做BaiduSpider,谷歌的蜘蛛叫做GoogleBot。只要在User-agent之后加上蜘蛛的名字,这个蜘蛛就可以爬取,如果允许所有的蜘蛛爬取,那么设置为User-agent:*  就可以了。Disallow是定义那些网页不可以被捉取,如果其单独列出来某网页的名称,标明该网页不可以捉取;若是以文件夹的形式,则表示整个文件夹里面的东西都不可以捉取。

   如设置所有的搜索引擎都可收录,但不能爬取a.html和b.php以及c文件夹的方法如下图:

设置搜索引擎不收录的方法

   第二种方法就是在连接上面加上rel=nofllow标签,这样蜘蛛爬取的时候就会跳过这些页面,可是当对多数页面采取这种发发时,工作量就比较大。

转载于:https://www.cnblogs.com/dingjiehao/archive/2013/03/17/2964064.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值