一个网站,如果有死链或者叫不存在的URL就会报404错误,那么对服务器性能或者SEO都是不好的,相关细节,可以上百度搜索。
 
     所以,下面和大家分享一个从日志上着手找404的命令,测试过,可以支持apache和nginx,当然,如果你format过日志格式就可能需要调整了。

     大家试试看
   
 
  
  1. cat www.abc.com-access_log* | awk '{if ($9==404) print $7}' > /abc/cat_www_abc_com_404.txt  
  2.   
  3. cat www.abc.com-access_log* | awk '{if ($9==404) print $7}' | sort | uniq -c | sort -n >> /abc/cat_www_abc_com_404.txt  

 

   这个代码的执行效率一般,但是比较好方便理解相关命令,优化的空间很大。

linux运维交流QQ群163544275