What is varnish?

                   Varnish是一种状态艺术,高性能的web加速器,它运行在linux2.6 kernel,freebsd6/7 和solaris 10系统上。
                   包含的一些特点:
                        1、 现代先进的架构设计
                        2、 VCL,一种非常灵活的配置语言
                        3、 后端服务器的负载均衡和健康检查
                        4、 局部支持ESI
                        5、 URL地址重写
                        6、 优雅的处理后端服务器宕机的问题
                   未来的特点(试验中)
                       1、 支持头文件分类
                       2、 支持持久缓存
                   Varnish是一个自由软件,他使用改进的BSD licenced。请阅读指南,开始你的varnish之旅。
      HOW……
         我们需要分配多少内存/硬盘空间给varnish?
                   需要根据实际情况而定。
                   我认为我们目前最好的指导就是你考虑一个符合成本效益的RAM配置,比如1-16G,SSD硬盘。
                   除非你肯定你需要它,因为很少有主板可以安装以TB为单位的RAM。
                   在另一方面,如果你的流量在Gb/s,那么你需要尽可能多的分配RAM。
                  
         我怎么让varnish使用更少的内存?
                   你不能,varnish操作时在内存中进行的,分配多少RAM给进程是kernel来确定。
                  
         我怎么命令varnish的一个实例忽略某个请求的参数?
                   你可以通过正则表达式删除一个请求的参数
                   sub vcl_recv {
                       set req.url = regsub(req.url, "\?.*", "");
                   }
        
         我怎么强制刷新varnish cache中的目标?
                   通常调用purging 一个内容。在varnish中,你至少有两种方法完成purge。
                          1、 命令行
                            在命令行输入以下代码:
                            url.purge ^/$
                            purge你的/目录,你可以发现url.purge命令使用一个正则表达式来匹配,因此“^”和“$”分别代表开始和结尾。所有以/开始的内容都会从cache中删除,所以,删除cache中所有的内容的写法如下:
                            url.purge .*
                        2、 HTTP PURGE
                             使用VCL代码完成HTTP PURGE的方法可以在 这里找到。注意,这个方法不支持通配符。
        
         我怎么对一个单独的client请求DEBUG?
                   Varnishlog工具可以很好的整理输出,有能力对我们自己的流量做DEBUG。
                   ReqStart 包含客户端IP,我们可以查看匹配他的IP
                            $ varnishlog -c -o ReqStart 192.0.2.123
                   想要查看这个IP地址在后端服务器的操作,我们可以匹配TxHeader,客户端单独的IP地址包含在 X-Forwarded-For 头信息里,然后发送给后端服务器。
                            $ varnishlog -b -o TxHeader 192.0.2.123
        
         我怎么在请求发送到后端服务器前重写URLS地址?
                   你可以使用regsub()函数来完成,下面是一个例子:
                           
                            if (req.http.host ~ "^(www.)?example.com")
                             { set req.url = regsub(req.url, "^",  "/VirtualHostBase/http/example.com:80/Sites/example.com/VirtualHostRoot");
                            }
        
         我有一个站点,它有很多主机名,我怎么保持cache的内容最少?
                   你可以在接收到头信息中规范所有主机名,VCL代码如下:
                            if (req.http.host ~ "^(www.)?example.com") {
                            set req.http.host = "example.com";
                            }
 
         我怎么修改到后端的请求?
                   你可以通过bereq修改到后端的请求,但是你只能使用“set”值,因此你可以使用req.url构造一个request:
                   sub vcl_miss {
                           set bereq.url = regsub(req.url,"stream/","/");
                           fetch;
                   }
 
 
 
         我怎么定制varnish返回的错误信息?
                   使用vcl_error可以定制一个错误页面。默认的错误页面如下:
                            sub vcl_error {
                                set obj.http.Content-Type = "text/html; charset=utf-8";
 
                                synthetic {"
                                <?xml version="1.0" encoding="utf-8"?>
                                <!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN"
                                 "http://www.w3.org/TR/xhtml1/DTD/xhtml1-strict.dtd">
                                <html>
                                  <head>
                                    <title>"} obj.status " " obj.response {"</title>
                                  </head>
                                  <body>
                                  <h1>Error "} obj.status " " obj.response {"</h1>
                                  <p>"} obj.response {"</p>
                                    <h3>Guru Meditation:</h3>
                                    <p>XID: "} req.xid {"</p>
                                    <address><a                                                                                                                                     href="http://www.varnish-cache.org/">Varnish</a></address>
                                  </body>
                                 </html>
                                 "};
                                deliver;
                            }
         怎样让varnish忽略请求的参数和只缓存目标的实例之一?
                   删除请求的参数使用一下表达式:
                   sub vcl_recv {
                                set req.url = regsub(req.url, "\?.*", "");
                   }
 
      where……
         我怎么找到适合我自己操作系统的安装包?
                   我们知道varnish提供debin,ubuntu,RHEL,centos,(open)SuSE,gentoo和freebsd,这些系统的二进制包,不管你使用什么包管理器,请阅读 “安装varnish”
 
      can i……
         我可以使用varnish做正向代理吗?
                   不可以,varnish需要配置所有后端服务器到VCL。
        
         我可以在32位机器上运行varnish吗?
                   可以,不过在32位机器上,会收到一定约束。Varnish在32位机器上不能支持大于2G的存储。推荐使用64 位机器。
        
         我能够在一台机器上同时运行varnish和apache吗?
                   可以,很多人成功使用了这种方法,不过这会导致资争用。
        
         我能在一个系统上运行多个varnish吗?
                   可以,指定不同的tcp端口就可以了。
        
         我可以使用一个varnish缓存多个虚拟主机吗?
                   可以,但是注意内存空间。
        
         我能查看varnish缓存了哪些东西吗?
                   一些原因导致不可能,如果一个命令列出所有缓存的内容,那么缓存的内容是上千万或者更多,这样会导致系统资源紧张,varnish暂停服务。
        
         我能用varnish加速https吗?
                   目前还不行,请密切关注我们,我们现在还没计划添加HTTPS支持,不过我们会想办法完成,就像nginx那样。
        
         我能够使用varnish负载均衡后端服务器吗?
                   可以,你可以使用以下VCL代码:
                                director foobar round-robin {
                           { .backend = { .host = "www1.example.com; .port = "http"; } }
                           { .backend = { .host = "www2.example.com; .port = "http"; } }
                                }
 
                                sub vcl_recv {
                        set req.backend = foobar;
                        }
                            (XXX: reference to docs, once written)
 
      why……
         为什么varnish将所有的请求都发到后端服务器去了?
         通常是两个问题导致的:
                 1、 目标的TTL过短。通常的解决方式是后端服务器不设置TTL,使用varnish默认的TTL。(默认是120s)
                 2、 你使用了cookies:
默认情况下,varnish不会缓存backend返回的带cookie的结果。
默认情况下,varnish不对包含cookie的请求服务,直接pass他们到后端服务器。
         为什么正则表达式有大小写之分?
                   在2.10版本之前使用POSIX的正则表达式没有大小写区分,但是2.10以后,使用了PCRE正则表达式,它就对大小写敏感了。(我们保证以后不会在改变这种思想)
                   让PCRE正则表达式不区分大小写,使用(?!)开始:
                            if (req.http.host ~ "?iexample.com$") {
                                    ...
                            }
                   查看PCRE man pages 了解更多信息。
        
         为什么头信息中“Via:”显示1.1,而varnish版本是2.1.x?
                   Via:number是HTTP协议,不是varnish版本号。
        
         为什么我们叫它“varnish”?
                1、 像varnish一样覆盖
                2、 顺利和平滑的完成任务
                3、 掩盖所有,赋予光滑的表面
         为什么安装varnish的系统需要C编译器?
                   VCL编译需要C编译器来完成。系统的C编译器把VCL编译成动态共享库,然后供varnish使用。所以没有C编译器,varnish不能运行。
        
         安全问题?
                   你可以在必须的时候修改c编译器的权限或者删除C编译器。
      排错
         为什么我收到一个缓存命中,而请求还是会发送到后端服务器?
                  Varnish有一个特色,就是hit for pass,当varnish得到一个后端服务器的响应但是发现这个目标不能被缓存,在这种情况,varnish将创建一个缓存目标记录这个事件,所以下次请求就会直接被pass。