robots.txt 优化使用

robots.txt文件的功能非常有限,它并不能诱使蜘蛛在你的网站上花费更多的时间或者访问更多的页面。但你可以发挥robots.txt文件的作用来对自己的网站进行一定的优化处理。

1. 每当一个用户试图访问一个已经不存在的URL时,服务器就会在日志中记录一个404错误(无法找到文件)。每当蜘蛛来寻找并不存在的robots.txt文件时,服务器也将在日志中记录一条404错误,所以你应该在网站根目录下添加一个robots.txt文件,哪怕是一个空白的robots文件也好。

2. 使蜘蛛程序远离某些服务器上的目录——保证服务器性能。避免将所有程序文件被蜘蛛索引,可以节省服务器资源。

3.robots.txt文件里还可以直接包括在sitemap文件的链接。就像这样:

Sitemap: http://www.lhxuji.com/sitemap.xml //这个通告对百度有一定的作用

Google网站管理员里有一个分析robots.txt工具,可以帮助我们分析robots.txt是否成功设置了阻止Google蜘蛛对特定网页的访问,以及robots.txt是否有语法错误等等。

1. https://www.google.com/webmasters/tools/

进入后,选择你要分析的网站,然后选择工具》》分析robots.txt

2. 进入后你可以看到有关你网站的robots.txt的基本信息

3.也可以对自己写的robots.txt文件进行相关的测试,填入你写的robots.txt文件和要测试的网站(包括被你阻止的地址)保障不出差错。

我使用的robots.txt

Sitemap: http://www.lhxuji.com/sitemap.xml

User-Agent: *

Disallow: /wp-content/

robots.txt语法:http://www.baidu.com/search/robots.html

转载于:https://www.cnblogs.com/JemBai/archive/2008/10/08/1306094.html

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值