编程方式刷新Squid缓存服务器的五种方法

原创 2012年03月22日 17:34:11

网站进行内容更新是常有的事情,当被缓存的资源更新时,前端Squid 缓存服务器内容也必须要相应的更新,否则用户就可能会看到过期的数据。当没有程序支持时就需要每次登录到服务器上执行刷新操作,在服务器数量小的的时候这种方式还可行,如果服务器数量上了一定的规模,这就是一种非常笨重的处理方式,以下分别介绍通过编程方式实现刷新 Squid 的三种方法:

 

1.  refresh_pattern 用于配置Squid 的刷新策略,当 Squid 没有配置 ignonre-reload 来忽略客户端no-cache 和 reload 头的时候。

ignore-reload - ignores a client no-cache or reload header. Doing this VIOLATES the HTTP standard. Enabling this feature could make you liable for problems which it causes. (ignore-reload, 忽略客户端 no-cache 或 reload 头,这是违反 HTTP 标准的做法,允许此特性可能导致相关问题 . )

 

在这种情况下可以通过模拟客户端向服务器发送no-cache 头( ctrl + f5 就完成此功能)来实现刷新操作。发送的请求头如下:

<?php
 /**
  * 刷新Squid缓存
  *
  */
 interface Flush_Cache
 {
  /**
   * 执行刷新操作
   *
   * @param void $url 待刷新的URL地址
   */
  public function flush($url);
 }
 
 /**
  * 通过发送HTTP Header头实现刷新功能
  *
  */
 class Flush_Cache_HTTP_Header_Impl implements Flush_Cache 
 {
  /**
   * @see Flush_Cache::flush()
   *
   * @param void $url
   */
  public function flush($url) 
  {
   if(empty($url))
   {
    return; 
   }
   $url_component = parse_url($url);
   global $g_squid_servers;
   
   foreach ($g_squid_servers as $server)
   {
    $squid_params = split(':' , $server);
    $fsocket = fsockopen($squid_params[0], intval($squid_params[1]), $errono, $errstr, 3);
    
    if(FALSE != $fsocket)
    {
     $head = "HEAD {$url_component['path']} HTTP/1.1/r/n";
     $head .= "Accept: */*/r/n";
     $head .= "Host: {$url_component['host']}/r/n";
     $head .= "Cache-Control: no-cache/r/n";
     $head .= "/r/n";
     
     echo $head;
     
     fwrite($fsocket , $head);
     
     while (!feof($fsocket))
     {
      $line = fread($fsocket , 4096);
      
      echo $line;
     }
     
     fclose($fsocket);
    }
   }
  }
 }
 
 $g_squid_servers = array('192.168.2.88:80');
 $flush_cache = new Flush_Cache_HTTP_Header_Impl();
 
 $flush_cache->flush('http://www.squid.com/');
?> 

2.  通过PURGE 头刷新缓存,这需要 Suqid 配置 ACL 以允许 PURGE 请求头,实例如下:

acl AdminBoxes src 127.0.0.1 172.16.0.1 192.168.0.1

acl Purge method PURGE

 

http_access allow AdminBoxes Purge

http_access deny Purge


 

打开配置之后可以使用如下的请求头来完成删除操作

PURGE http://www.squid.org/junk HTTP/1.0 
Accept: */* 

上个例子代码中,把HEAD 修改为 PURGE 即可,如下:

 

view plaincopy to clipboardprint?
01.$head = "PURGE {$url_component['path']} HTTP/1.1/r/n";   
02.$head .= "Accept: */*/r/n";   
03.$head .= "Host: {$url_component['host']}/r/n";   
04.$head .= "Cache-Control: no-cache/r/n";   
05.$head .= "/r/n";  
$head = "PURGE {$url_component['path']} HTTP/1.1/r/n";
$head .= "Accept: */*/r/n";
$head .= "Host: {$url_component['host']}/r/n";
$head .= "Cache-Control: no-cache/r/n";
$head .= "/r/n";
 

 

3.  通过使用多播HTCP 包来完成 Squid 清理,这是 MediaWiki 目前正在使用的方法,当wiki 更新时用于更新全球的 Squid 缓存服务器,实现原理为:发送 PURGE 请求到特定的多播组,所有 Squid 服务器通过订阅该多播组信息完成删除操作,这种实现方式非常高效,避免了 Squid 服务器处理响应和建立 TCP 连接的开销。参考资料: Multicast HTCP purging  

 

发送no-cache 头的方式在很多情况下不适用,因为大多数站长都会配置 ignore-reload 来阻止 no-cache 和 reload 头以提高 Squid 的命中率;通过适当的权限控制 PURGE 清理将是一种非常简单可行的方式,考虑到安全问题我们可以仅允许特定的主机进行 PURGE 清理操作,对第 1 , 2 种方式 进行简单的变通就可以用于管理较大规模数量的前端缓存服务器 - 我们可以在被允许的主机上提供一个专门的后台刷新队列,这个刷新队列在接收到刷新操作时就多线程的向前端服务器发送删除指令,这样就达到了同步刷新的效果。第3种方式没有进行过尝试,因为需要安装相应的补丁,并进行配置,操作成本相对较高,在服务器数量特别巨大的情况下这无疑是一种非常高效的实现方式。

4  批量清除Squid缓存的小工具 
很实用的一个清除squid缓存的小工具:
http://www.wa.apana.org.au/~dean/squidpurge/

wget http://www.wa.apana.org.au/~dean/sources/purge-20040201-src.tar.gz 
tar zxvf purge-20040201-src.tar.gz
cd purge
make
[root@cache purge]# ./purge -help
### Use at your own risk! No guarantees whatsoever. You were warned. ###

$Id: purge.cc,v 1.17 2000/09/21 10:59:53 cached Exp $
Usage: purge [-a] [-c cf] [-d l] [-(f|F) fn | -(e|E) re] [-p h[:p]]
[-P #] [-s] [-v] [-C dir [-H]] [-n]

-a display a little rotating thingy to indicate that I am alive (tty only).
-c c squid.conf location, default "/usr/local/squid/etc/squid.conf".
-C dir base directory for content extraction (copy-out mode).
-d l debug level, an or of different debug options.
-e re single regular expression per -e instance (use quotes!).
-E re single case sensitive regular expression like -e.
-f fn name of textfile containing one regular expression per line.
-F fn name of textfile like -f containing case sensitive REs.
-H prepend HTTP reply header to destination files in copy-out mode.
-n do not fork() when using more than one cache_dir.
-p h:p cache runs on host h and optional port p, default is localhost:3128.
-P # if 0, just print matches; otherwise or the following purge modes:
0x01 really send PURGE to the cache.
0x02 remove all caches files reported as 404 (not found).
0x04 remove all weird (inaccessible or too small) cache files.
0 and 1 are recommended - slow rebuild your cache with other modes.
-s show all options after option parsing, but before really starting.
-v show more information about the file, e.g. MD5, timestamps and flags.

1.清除URL中包含jackbillow.com的所有缓存
./purge -p 127.0.0.1:80 -P 1 -se 'jackbillow.com'

2.清除 URL 以“.mp3”结尾的缓存文件,例如:http://www.dzend.com/abc/test.mp3 
./purge -p 127.0.0.1:80 -P 1 -se '/.mp3$'

批量删除squid缓存脚本

Squidweb缓存加速软件目前已经 是新浪、搜狐、网易等各大网站广泛应用。Squid会在设置的缓存目录下建立多个目录,每一个目录下又建立多个目录,然后才在最里层的目录中存放缓存文件(object)。squid会根据用户请求网页的URL进行哈希,生成缓存文件,存放在某一个目录中。squid启动之后,将在内存中建立一个哈希表,记录硬盘中缓存文件配置的情形。

对于类似http://you.video.sina.com.cn/index.html之类的网页,squid只会生成一个缓存文件。可以用squid附带的squidclient工具清除:

squidclient -m PURGE -p 80 http://you.video.sina.com.cn/index.html

注意:

Squid接受一种客户请求方式,用于删除cache对象。PURGE方式并非官方HTTP请求方式之一。它与DELETE不同,对后者, squid将其转发到原始服务器。PURGE请求要求squid删除在uri里提交的目标。squid返回200(OK)或404(Not Found)。

PURGE方式某种程度上有点危险,因为它删除了cache目标。除非你定义了相应的ACL,否则squid禁止PURGE方式。正常的,你仅仅允许来自本机和少数可信任主机的PURGE请求。配置看起来如下:

acl AdminBoxes src 127.0.0.1 172.16.0.1 192.168.0.1

acl Purge method PURGE

http_access allow AdminBoxes Purge

http_access deny Purge

而对于带有参数的网页,例如新浪播客的Flash播放器http: //vhead.blog.sina.com.cn/player/outer_player.swf?auto=0&vid=4469852& uid=1278987704,因“?”后面的参数不同,导致URL也不同,squid会生成多个缓存文件,哈希分散存放在不同的目录。如果修改了这个 outer_player.swf文件,要更新squid缓存就要去清除不同目录下及内存中的很多个缓存文件,十分麻烦,于是我编写了一个Linux下的 shell脚本,去完成这件麻烦的事:

  脚本文件名:clear_squid_cache.sh

  #!/bin/sh

  squidcache_path="/data1/squid/var/cache"

  squidclient_path="/usr/local/squid/bin/squidclient"

  grep -a -r $1 $squidcache_path/* | strings | grep "http:" | awk -F'http:' '{print "http:"$2;}' >cache_list.txt

  for url in `cat cache_list.txt`; do

  $squidclient_path -m PURGE -p 80 $url

  done

注意: 请赋予clear_squid_cache.sh可执行权限(命令:chmod +x ./clear_squid_cache.sh)。请确保脚本所在目录可写。

  设置:

  squidcache_path= 表示squid缓存目录的路径

  squidclient_path= 表示squidclient程序所在的路径,默认为squid安装目录下的bin/squidclient

用法:

  1、清除所有Flash缓存(扩展名.swf):

  ./clear_squid_cache.sh swf

  2、清除URL中包含sina.com.cn的所有缓存:

  ./clear_squid_cache.sh sina.com.cn

  3、清除文件名为zhangyan.jpg的所有缓存:

  ./clear_squid_cache.sh zhangyan.jpg

效率:

经测试,在DELL 2950上清除26000个缓存文件用时2分钟左右。平均每秒可清除缓存文件177个。


Squid web缓存加速软件目前已经是新浪、搜狐、网易等各大网站广泛应用。Squid会在设置的缓存目录下建立多个目录,每一个目录下又建立多个目录,然后才在最里层的目录中存放缓存文件(object)。squid会根据用户请求网页的URL进行哈希,生成缓存文件,存放在某一个目录中。squid启动之后,将在内存中建立一个哈希表,记录硬盘中缓存文件配置的情形。


  对于类似http://you.video.sina.com.cn/index.html之类的网页,squid只会生成一个缓存文件。可以用squid附带的squidclient工具清除:


引用
squidclient -m PURGE -p 80 "http://you.video.sina.com.cn/index.html"




  而对于带有参数的网页,例如新浪播客的Flash播放器http://vhead.blog.sina.com.cn/player/outer_player.swf?auto=0&vid=4469852&uid=1278987704,因“?”后面的参数不同,导致URL也不同,squid会生成多个缓存文件,哈希分散存放在不同的目录。如果修改了这个outer_player.swf文件,要更新squid缓存就要去清除不同目录下及内存中的很多个缓存文件,十分麻烦,于是我编写了一个Linux下的shell脚本,去完成这件麻烦的事:


  脚本文件名:clear_squid_cache.sh(8月2日修正了UC网友“城市中的寂寞”反馈的BUG)


引用
#!/bin/sh
squidcache_path="/data1/squid/var/cache"
squidclient_path="/usr/local/squid/bin/squidclient"
grep -a -r $1 $squidcache_path/* | strings | grep "http:" | awk -F'http:' '{print "http:"$2;}' > cache_list.txt
for url in `cat cache_list.txt`; do
$squidclient_path -m PURGE -p 80 $url
done


  注意:请赋予clear_squid_cache.sh可执行权限(命令:chmod +x ./clear_squid_cache.sh)。请确保脚本所在目录可写。


  设置:
  squidcache_path= 表示squid缓存目录的路径
  squidclient_path= 表示squidclient程序所在的路径,默认为squid安装目录下的bin/squidclient


  用法:
  1、清除所有Flash缓存(扩展名.swf):
  ./clear_squid_cache.sh swf


  2、清除URL中包含sina.com.cn的所有缓存:
  ./clear_squid_cache.sh sina.com.cn


  3、清除文件名为zhangyan.jpg的所有缓存:
  ./clear_squid_cache.sh zhangyan.jpg


  效率:
  经测试,在DELL 2950上清除26000个缓存文件用时2分钟左右。平均每秒可清除缓存文件177个。 






Tags: linux , squid , cache
 技术大类 ? Cache与存储 | 评论(10) | 引用(0) | 阅读(18568) 
引用地址: 
注意: 该地址仅在今日23:59:59之前有效
你好 2008-8-4 10:33 
client: ERROR: Cannot connect to localhost:80: Connection refused




缓存清理脚本出现的错误信息 不知道哪里出错了
帮忙看一下 谢谢了 
todayboy  2008-12-20 14:24 
client: ERROR: Cannot connect to localhost:80: Host unknown.


我也有同样的错误,不知是什么原由:
[root@mamiai01 etc]# . clear_squid_cache.sh  .jpg
client: ERROR: Cannot connect to localhost:80: Host unknown.
client: ERROR: Cannot connect to localhost:80: Host unknown.
HTTP/1.1 301 Moved Permanently
Server: nginx/0.5.23
Date: Sat, 20 Dec 2008 06:22:33 GMT
Content-Type: text/html
Content-Length: 185
Connection: close
Location: http://bjdns3.cncmax.cn:8080?HOST=mamiai.cn&R=/mamiai/baby/images/index_81_13.jpg& 
D  2009-4-3 15:53 
运行squidclient -h ip PURGE http://ip:port/index.html
提示 403 forbidden 
xi2008wang 2009-5-6 17:03 
ls的兄弟, 不是哪个人都能随便清除的.
看一下htcp_clr_access就知道了
默认是拒绝所有人
htcp_clr_access deny all


并且squid在编译时要加上--enable-htcp 
小丑鱼  2010-1-20 16:48 
张老师我觉得你的grep那段结果还是会出来很多不相关的连接,我对你的grep优化了下好像有好转,你看下


grep -aR $1 $squidcache_path/* | strings | grep "^http:" |grep "$1$" > cache_list.txt 
aa 2010-6-29 16:03 
看一下你/etc/hosts是否是正常的
client: ERROR: Cannot connect to localhost:80: Host unknown.


我也有同样的错误,不知是什么原由:
[root@mamiai01 etc]# . clear_squid_cache.sh  .jpg
client: ERROR: Cannot connect to localhost:80: Host unknown.
client: ERROR: Cannot connect to localhost:80: Host unknown.
HTTP/1.1 301 Moved Permanently
Server: nginx/0.5.23
Date: Sat, 20 Dec 2008 06:22:33 GMT
Content-Type: text/html
Content-Length: 185
Connection: close
Location: http://bjdns3.cncmax.cn:8080?HOST=mamiai.cn&R=/mamiai/baby/images/index_81_13.jpg& 
心远 2010-8-4 10:51 
[root@vps238 bin]# ./clear_squid_cache.sh uggs4sale.com
grep: /dev/kmem: Permission denied
不知道这是什么原因? 
狂奔的鹿 2010-12-21 15:33 
client: ERROR: Cannot connect to localhost:80: Host unknown.
client: ERROR: Cannot connect to localhost:80: Host unknown.


HOSTS文件没有解析localhost                 打/etc/hosts   添加  127.0.0.1 localhost 
dresses   2011-7-26 10:14 
Here are a variety of the empire <a href="http://www.romancearound.com/">dresses</a>, I want to introduce yourself. The first shoulder chiffon <a href="http://www.romancearound.com/bridesmaid-dresses-c-197.html">bridesmaid dresses</a> empire style wedding will <a href="http://www.romancearound.com/wedding-dresses-trumpet-wedding-dresses-c-180_253.html">trumpet wedding dresses</a>.This Tia cowries, dressed in her wedding day.Chiffon of the empire the best clothes, because they are the size of the drum as complete motion from the wind the site makes it easy to create a plan impression.One romantic flowers floating above shoulder function and help catch the eyes of the cut of the chest and neck problems, so that more comprehensive coverage of physical illusion bust.Clothing do not like big long torso, short legs, or pear-shaped<a href="http://www.romancearound.com/bridesmaid-dresses-ankle-length-bridesmaid-dresses-c-197_198.html">ankle length bridesmaid dresses</a> figure.special is also suitable for pregnant brides since the mobility as a dress can accommodate more Many of the abdomen. 
louis vuitton uk   2011-11-23 08:48 
This louis vuitton uk for sale belongs to the sounding just what are termed as Louis Vuitton vintage best sellers, many other products and services for the reason that range appearing companies.You will easily notice the unfold zippers of this coach outlet store online. That is the decoration. There are some inside pockets for you as well. They are easy to match your clothes and to carry.Let us inspire your inner beauty with fine christian louboutin sale. Purse the elegance in bridal wedding. Enjoy the fashion. 


作者:张 宴
批量清除Cache的工具:
http://www.wa.apana.org.au/~dean/squidpurge/
wget http://www.wa.apana.org.au/~dean ... 20040201-src.tar.gz
tar zxvf purge-20040201-src.tar.gz
cd purge
make

  清除Squid缓存示例:
  1、清除 URL 以“.mp3”结尾的缓存文件(例如 http://www.s135.com/abc.mp3http://www.s135.com/01/a.mp3

./purge -p localhost:80 -P 1 -se '\.mp3$'

  2、清除URL中包含s135.com的所有缓存:

./purge -p localhost:80 -P 1 -se 's135.com'

  我喜欢将程序推到后台去执行,让它慢慢地去清Squid缓存,同时将输出内容记录到purge.log文件:

./purge -p localhost:80 -P 1 -se 's135.com' > purge.log 2>&1 &


版权声明:本文为博主原创文章,未经博主允许不得转载。

相关文章推荐

编程方式刷新Squid缓存服务器的五种方法

网站进行内容更新是常有的事情,当被缓存的资源更新时,前端Squid 缓存服务器内容也必须要相应的更新,否则用户就可能会看到过期的数据。当没有程序支持时就需要每次登录到服务器上执行刷新操作,在服务器数量...

高性能缓存服务器Squid架构配置

随着网站访问人数越来越多,承受的并发和压力也越来越高,这时候我们需要对网站和架构进行优化,今天我们来讨论使用Squid对架构进行优化,缓存网站。网上对squid描述的文章也有成千上万,我这里简单记录一...
  • joeyon
  • joeyon
  • 2015年06月05日 14:48
  • 725

squid编译安装 web缓存服务器

先安装webp、jpeg、png等库http://www.linuxfromscratch.org/blfs/view/svn/general/libwebp.html 先下载libwebp-0.3....

ROS 软路由配合squid WEB缓存服务器中实现行为管理

公司使用的ROS 软路由 和Cisco 交换机,划分的Vlan网络,路由器是ROS,在部署行为管理时,只能用端口镜像,但效果,表现比较一般,不能过滤内容,且公司终端数据比较多,网络出口压力日渐增大,需...

高性能缓存服务器Varnish

  • 2014年04月21日 14:04
  • 212KB
  • 下载

memcached 分布式缓存服务器

  • 2008年12月15日 10:57
  • 91KB
  • 下载

打造高性能nginx缓存服务器

一、nginx缓存     Nginx从0.7.48版本开始,支持了类似Squid的缓存功能。这个缓存是把URL及相关组合当作Key,用md5编码哈希后保存在硬盘上,所以它可以支持任意URL链接...

lnux 本地构建缓存服务器

  • 2016年05月12日 15:49
  • 1.12MB
  • 下载

Memcached缓存服务器

  • 2016年04月19日 20:43
  • 170KB
  • 下载

Varnish+Nginx搭建缓存服务器

1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 1...
  • joeyon
  • joeyon
  • 2015年06月19日 17:46
  • 1024
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:编程方式刷新Squid缓存服务器的五种方法
举报原因:
原因补充:

(最多只允许输入30个字)