当Varnish遇到带参数的URL(这些参数还经常变)的时候,通常会存在同一个真正的URL存放多份缓存及缓存命中率低的情况,根据官方网站的文档说明,可以在sub_recv中加入如下段解决。
if (req.url ~ ".(jpg|gif|png)\?.*") {
set req.url = regsub(req.url, "\?.*", "");
}
但当实际设置了以后仍然会出现URL参数变化后Varnish返回miss,这说明Varnish实际上还是以全部req.url作为hash进行缓存的。有兴趣的同学可以自己试试:)
我想了很久,最后终于发现这个重置了以后的req.url并没有作为sub_hash中hash key进行缓存,于是做了如下变通终于实现了按照不带参数的URL进行缓存以达到提高缓存命中率和避免多份缓存的目的。
其实配置的方法很简单,即
sub_hash {
if (req.url ~ ".(jpg|gif|png)\?.*") {
set req.hash += regsub(req.url, "\?.*", "");
}
else {
set req.hash += req.url;
}
hash;
}
Varnish 2.0.2和2.0.3版本都有这个问题,我已在官方网站报了bug,见http://varnish.projects.linpro.no/ticket/465 各位有兴趣的也可关注一下:)
更新: 在sub_recv中set req.url = regsub(req.url, "\?.*", "");即可,不用再在hash中添加
在header中添加cache的命中状态的方法(在sub_deliver中添加)
if (obj.hits > 0) {
set resp.http.X-Cache = "Server-6-HIT";
} else {
set resp.http.X-Cache = "Server-6-MISS";
}
替换到后端的URL请求
sub vcl_miss {
if (req.request == "PURGE") {
error 404 "Not in cache.";
}
set bereq.url = regsub(req.url, "\?.*", "");
fetch;
}