WordPress网站的robots文件代码怎样写比较好

本文记载和介绍的是wordpress的robots.txt的在哪儿?以及如何修改robots文件来禁止搜索引擎爬取/ajax目录下的文章。以及如何优化WordPress网站的robots文件

wordpress设置robots文件的目录:/wp-includes/functions.php,然后搜索do_robotstxt,大概在1699行。

在functions.php中,wordpress默认设置的robots文件是:

$output = "User-agent: *\n";
    $public = get_option( 'blog_public' );

    $site_url = parse_url( site_url() );
    $path     = ( ! empty( $site_url['path'] ) ) ? $site_url['path'] : '';
$output  .= "Disallow: $path/wp-admin/\n";
$output  .= "Allow: $path/wp-admin/admin-ajax.php\n";
  • 第一个output变量是允许所有的蜘蛛爬取页面,
  • 第二个output变量是禁止爬取/wp-admin/目录下的所有文件,
  • 第三个则是允许爬取/wp-admin/admin-ajax.php文件。

如果需要修改wordpress默认的robots禁止蜘蛛爬取某一个文件目录,这个时候直接再写入一个output变量,后面再写入需要禁止的目录名称即可。我需要禁止ajax目录,直接写入一个output变量,禁止爬取ajax目录就OK了。

关于wordpress的robots.txt文件在哪儿?wordpress修改robots文件的方法一文就记载到这,后续将观察禁止蜘蛛爬取ajax目录后,百度会不会继续收录此类目录下的页面。

下面小编整理的一些WordPress网站的robots.txt内容参考:

User-Agent: * (*星号,表示允许所以的搜索引擎蜘蛛)

Disallow: /wp-admin/ (disallow 表示不允许,不允许爬取/wp-admin/核心文件目录)

Disallow: /wp-includes/ (不允许爬取/wp-includes/核心文件目录)

Disallow: /wp-content/plugins (不允许爬取wordpress插件目录)

Disallow: /wp-content/themes (不允许爬取wordpress主题目录)

Disallow: /plus/ad_js.php (不允许爬取这个PHP文件)

Disallow: /plus/posttocar.php

Disallow: /anli/weixin (其它目录)

Disallow: /themes

Disallow: /get_activation

Disallow: /*?* (不允许蜘蛛爬取URL中带问号的链接)

Disallow: /*&* (不允许蜘蛛爬取URL中带&的链接)

Disallow: /*.rar (不允许蜘蛛爬取rar后缀的文件)

Disallow: /*.zip (不允许蜘蛛爬取zip后缀的压缩文件)

Sitemap: http : //xxx . com/sitemap.html (允许蜘蛛爬取网站静态地图)

Sitemap: http : //xxx . com/sitemap.xml (允许蜘蛛爬取sitemap网站地图)

robots.txt代码的规则还是非常简单的,就那么几个关键词:

User-Agent(搜索引擎蜘蛛名)、

Disallow(不允许)、

Allow(允许)、

Sitemap(指定网站的地图文件)。

如果我们只想让百度蜘蛛爬取我们的wordpress网站,而不让其它的搜索引擎蜘蛛进我的网站爬取,我们可以把上面代码中的User-Agent:* 修改成 User-Agent:baiduspider

另外,“Disallow: /wp-admin/” 与 “Disallow: /wp-admin”也表示不同的意思,虽然后面的只少了一个斜杠。“Disallow: /wp-admin/”表示禁止搜索引擎蜘蛛爬取网站wp-admin目录下的目录,但include目录中的文件仍然可以爬取;而“Disallow: /wp-admin”表示禁止搜索引擎蜘蛛爬取网站wp-admin整个目录,包括其下的所有文件。

如果想禁止搜索引擎蜘蛛爬取全站,可以用 Disallow: / ;

如果想允许搜索引擎蜘蛛可以爬取全站,可以用Allow:/;

如果想禁止搜索引擎蜘蛛爬取wordpress网站的全部PHP文件,可以用Disallow: /*.php 。

以上就是我们今天介绍的所有内容——如何为我们的wordpress网站添加robots.txt文件?每一个wordpress网站,可能的限制不一样,所以,我们都要根据自己网站情况,做出相应的修改,以达到最佳效果。注意:Disallow: /可千万要小心用哦,除非在我们wordpress网站的建站初期——网站还在建设当中,不希望搜索引擎来打扰。但一定要记住,等网站做好了,一定要去掉这个Disallow: / 。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值