Robots.txt详解

最新推荐文章于 2025-02-21 16:30:00 发布

weixin_44349875

最新推荐文章于 2025-02-21 16:30:00 发布

阅读量7.1k

点赞数 6

分类专栏： SEO

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44349875/article/details/87912764

版权

SEO 专栏收录该内容

26 篇文章

订阅专栏

Robots协议（也称爬虫协议，机器人协议等）的全称是“网络爬虫排除协议”，网站通过Robots协议告诉搜索引擎哪些页面可以抓取，哪些页面不能抓取。

Robots.txt的作用：

可以让蜘蛛更高效的爬行网站；
可以阻止蜘蛛爬行动态页面，从而解决重复收录的问题；
可以减少蜘蛛爬行无效页面，节省服务器带宽；

如何制作Robots.txt文件？

创建一个文本文档，重命名为Robots.txt，编写规则，用FTP把文件上传到空间；

创建robots.txt文件需要注意的问题：

必须是txt结尾的纯文本文件；
文件名所有字母必须是小写；
文件必须要放在网站根目录下；

Robots参数：

User-agent：

作用：用于描述搜索引擎蜘蛛的名字；

技巧：

1，当robots.txt不为空的时候，必须至少有一条user-agent的记录；

2，相同名字，只能有一条，但是不同的蜘蛛，可以有多条记录；

Disallow：

作用：用于描述不允许搜索引擎蜘蛛爬行和抓取的url；

使用技巧：

在robots.txt中至少要有一条disallow；
Disallow记录为空，则表示网站所有页面都允许被抓取；
使用disallow，每个页面必须单独分开声明；
注意disallow：/abc/和disallow：/abc的区别；

Allow：

作用：用于描述搜索引擎蜘蛛爬行和抓取的url；

使用技巧：搜索引擎默认所有的url是Allow；

Sitemap：主要作用：向搜索引擎提交网站地图，增加网站收录；

注意事项：

可以使用#进行注释；

参数后面的冒号要加一个空格；

参数开头第一个字母要大写；

注意蜘蛛名称的大小写；

使用建议：

写完robots.txt文件，到站长平台检查是否有误；

内容越简单越好，遵守规范，不要放置其他内容；

无特殊情况，可以建立空robots.txt文件；

新站不要使用robots.txt文件屏蔽所有内容；

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。