ROBOTS协议

1、Robots协议简介

 Robots协议的全称即网络爬虫排除标准”(Robots Exclusion Protocol),,网站通过Robots协议告诉搜索引擎(或者网络蜘蛛)可以抓取的页面范围。
 robots.txts是一个文本文件,是一个协议,而并非一个命令,其放置在网站的根目录下。robots.txt文件是搜索引擎访问网站时查看的第一个文件,若站点存在robots.txt文件,搜索引擎根据该文件中的内容访问确定的范围;若该文件不存在,则搜索引擎可以访问所有没有被保护的界面。
以某站点为例,其robots.txt文件如图所示:

这里写图片描述

2、Robots协议作用

1、设置网络爬虫访问权限,以保护网站;
2、控制搜索引擎的搜索范围,集中权值到主要界面,而无用界面对于搜索引擎优化而言作用不大;
3、网站内容为个人所有,其意愿应被搜索引擎所尊重,robots协议给了网站所有者表达自己意愿的机会;

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值