CCbot是什么梗？

最新推荐文章于 2023-03-14 10:26:28 发布

MAY的SEO博客

最新推荐文章于 2023-03-14 10:26:28 发布

阅读量1k

收藏

点赞数 1

分类专栏： SEO 文章标签：搜索引擎

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Almayli/article/details/107023741

版权

SEO 专栏收录该内容

13 篇文章 1 订阅

订阅专栏

不清楚您的网站日志中是否有出现过一个不太常见的CC蜘蛛，访问名称为：CCBot/2.0，下面我们具体来了解一下CCbot是什么蜘蛛？

CCbot

一. CCbot是什么蜘蛛？

CCbot，全称为Common Crawl Bot，是一个非营利性基金会致力于提供可以被所有人访问和分析的Web爬网数据的开放存储库。

二. 你如何处理CCbot蜘蛛？

方法1. 使用robots.txt

使用robots.txt文件来允许或禁止蜘蛛访问页面的权限。robots.txt是放在网站根目录中，蜘蛛来访问时会先查找并查看robots.txt文件，并遵守robots协议来访问网站上的内容，允许访问则访问，不允许访问蜘蛛则离开。

①. 不允许任何蜘蛛访问您站点的任何部分

User-agent：*
Disallow：/

②. 允许任何蜘蛛访问您站点的任何部分

User-agent：*
Disallow：

③. 不允许CCbot蜘蛛访问网站的任何部分

User-agent：ccbot
Disallow：/

④. 允许CCbot蜘蛛访问您站点的任何部分

User-agent：ccbot
Disallow：

⑤. 允许CCbot蜘蛛访问您站点，但不允许CCbot访问“wp-admin”文件夹

User-agent：ccbot
Disallow：/wp-admin

方法2. 使用元标记

可以在页面中使用元标记来帮助控制搜索引擎蜘蛛对您网站的访问权限。如果您为所有页面使用模板，则可以在<head> 和 </ head> 之间添加元标记，它将适用于使用该模板的所有页面。如果要控制特定页面，可以在<head> 和 </ head> 之间的各个页面上添加元标记。

①. 允许所有蜘蛛访问您的页面

<meta name =“robots”content =“index”/>

②. 允许所有蜘蛛访问您的网页并跟踪页面上的链接

<meta name =“robots”content =“index，follow”/>

③. 允许所有蜘蛛访问您的网页，但不允许他们跟踪链接

<meta name =“robots”content =“index，nofollow”/>

④. 不允许任何蜘蛛访问您的网页

<meta name =“robots”content =“noindex”/>

⑤. 允许CCbot访问您的网页

<meta name =“ccbot”content =“index”>

⑥. 不允许CCbot访问您的页面

<meta name =“ccbot”content =“noindex”>

⑦. 允许CCbot访问您的页面并跟踪更多页面的链接

<meta name =“ccbot”content =“index，follow”>

如果你在网站日志中也发现了CCbot，不要惊慌，你接下来需要做的就是是允许它继续爬行还是禁止爬行？May个人觉得这类蜘蛛没有多大的意义，一旦发现这类蜘蛛爬行比较频繁，最好的方式就是禁止这些蜘蛛继续访问我们的网站。

原创：MAY的SEO博客 https://may90.com/share/ccbot.html 未经允许，请勿转载！

MAY的SEO博客

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。

余额充值