笔记内容:

  • 11.22 访问日志不记录静态文件

  • 11.23 访问日志切割

  • 11.24 静态元素过期时间

笔记日期:2017.10.10


11.22 访问日志不记录静态文件

2433

使用浏览器打开一个网站时,我们可以按F12打开控制台,在Network中可以看到许多在访问时下载的静态文件,这些对静态文件的请求都会记录到访问日志里面的:

2434

因为静态的图片太多了,如果每一个请求全都要记录在访问日志里的话,就会导致访问日志一天下来可能得记录几个G甚至十几个G的内容,但是这种静态图片的请求是没必要去记录在访问日志里的,所以我们要让访问日志不记录指定类型的文件。

  1. 修改虚拟主机配置文件,修改成如下内容:

   vim /usr/local/apache2.4/conf/extra/httpd-vhosts.conf

<VirtualHost *:80>

   DocumentRoot "/data/wwwroot/www.123.com"

   ServerName www.123.com

   ServerAlias 123.com

   SetEnvIf Request_URI ".*\.gif$" img

   SetEnvIf Request_URI ".*\.jpg$" img

   SetEnvIf Request_URI ".*\.png$" img

   SetEnvIf Request_URI ".*\.bmp$" img

   SetEnvIf Request_URI ".*\.swf$" img

   SetEnvIf Request_URI ".*\.js$" img

   SetEnvIf Request_URI ".*\.css$" img

   CustomLog "logs/123.com-access_log" combined env=!img

</VirtualHost>

2435

这个标记的名称可以任意自定义。


修改完后加载一下配置文件,这时访问以这些后缀类型结尾的文件的访问就不会被记录了:

2436


现在我上传一张图片,然后用浏览器进行访问,模拟一下这种请求看看是否会记录日志:

1.上传图片文件到/data/wwwroot/111.com 目录下:

2437


  1. 使用浏览器进行访问:

2438


3.查看日志文件:

2439

可以看到日志文件里并没有记录访问test.jpg的日志信息。


如果把env=!img这段给删除了,就不会进行过滤了,所以真正实现过滤作用的是这一段。

11.23 访问日志切割

2440

日志都是需要进行自动切割的,因为无论什么日志日积月累地追加记录数据,都会导致文件大小越来越大直至占满整个磁盘,所以有必要让它自动切割,并删除旧的日志文件。

  1. 把虚拟主机配置文件改成如下内容:

<VirtualHost *:80>

   DocumentRoot "/data/wwwroot/www.123.com"

   ServerName www.123.com

   ServerAlias 123.com

   SetEnvIf Request_URI ".*\.gif$" img

   SetEnvIf Request_URI ".*\.jpg$" img

   SetEnvIf Request_URI ".*\.png$" img

   SetEnvIf Request_URI ".*\.bmp$" img

   SetEnvIf Request_URI ".*\.swf$" img

   SetEnvIf Request_URI ".*\.js$" img

   SetEnvIf Request_URI ".*\.css$" img

CustomLog "|/usr/local/apache2.4/bin/rotatelogs -l logs/123.com-access_%Y%m%d.log 86400" combined env=!img

</VirtualHost>

2441


修改完后重新加载配配置文件,并使用curl命令访问这个主机:

2442


然后查看日志目录就会发现生成了一个新的日志文件:

2444


像这样切割后,查看某一天或某个日期段的日志也很方便,但是以上这仅仅只是做了日志的自动切割,如果要实现自动删除旧的日志,需要写一个任务计划脚本让系统去自动删除规定时间的日志。





11.24 静态元素过期时间

2445

当我们使用浏览器打开一个网站的时候,浏览器会将页面上的静态元素:图片、样式、动画等,缓存到一个目录里存放着,下次访问时就不需要再次请求服务器进行下载了。

但是这些缓存是有一个规定的过期时间的,这个时间是在服务器上定义的,到了过期时间后这些缓存的静态元素都会被清空,这时再访问那个网站的时候就得重新下载了。

这个细节可以在浏览器的控制台上观察到:

2446

但是我们这个没有定义静态元素的过期时间,这个缓存就不会清空(如果你没有使用清理垃圾的软件),除非这个图片进行了更改,那么过多的缓存也会导致系统缓存垃圾太多,占用磁盘空间。

所以我们学习一下如何定义静态元素的过期时间,这里需要用到一个模块:mod_expires.c

1.给虚拟主机配置文件增加如下内容:

<IfModule mod_expires.c>

   ExpiresActive on  //打开该功能的开关

   ExpiresByType p_w_picpath/gif  "access plus 1 days"

   ExpiresByType p_w_picpath/jpeg "access plus 24 hours"

   ExpiresByType p_w_picpath/png "access plus 24 hours"

   ExpiresByType text/css "now plus 2 hour"

   ExpiresByType application/x-javascript "now plus 2 hours"

   ExpiresByType application/javascript "now plus 2 hours"

   ExpiresByType application/x-shockwave-flash "now plus 2 hours"

   ExpiresDefault "now plus 0 min"

</IfModule>

2447


  1. 配置完成后检查一下语法有没有问题,并且查看是否有加载这个模块:

2448

如图可以看到并没有加载expires模块,那么就得去编辑一下httpd的主配置文件,把expires模块的注释去掉:

vim /usr/local/apache2.4/conf/httpd.conf

2449


修改完后重新加载一次,并且查看一下是否有加载expires模块:

2450

如图可以看到模块已经被httpd加载了。


现在先在浏览器上Ctrl+F5强制刷新一下,然后在控制台上就可以看到状态码也改变了,并且能后看到服务器定义的过期时间:

2451

还会显示过期的时间:

2452


这时再次刷新就会变成304的状态码:

2453


使用curl命令也可以看到这些信息:

2454

如果把expires模块给去掉就不会有这些信息了。



扩展

apache日志记录代理IP以及真实客户端IP

http://ask.apelearn.com/question/960


apache只记录指定URI的日志

http://ask.apelearn.com/question/981


apache日志记录客户端请求的域名

http://ask.apelearn.com/question/1037


apache 日志切割问题

http://ask.apelearn.com/question/566