squid缓存代理服务
squid主要作用
- 代替客户机向网站发出请求,用来隐藏真实的用户ip
- 将获得的网页数据保存到缓存中并发送给客户机,以便下次请求相同的数据时快速响应
三种代理类型
- 传统代理:适用于Internet,需在客户机指定代理服务器的地址和端口。
- 反向代理:如果 Squid 反向代理服务器中缓存了该请求的资源,则将请求的资源直接返回给客户端;否则反向代理服务器将向后台的 web服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地
- 透明代理:客户机不需指定代理服务器的地址和端口,而是通过默认路由、防火墙策略将Web访问重定向给代理服务器
使用代理的理由
- 可以隐藏真实的用户ip
- 如果代理服务器本地有缓存,可以提高web的访问速度
squid实验
实验环境
Squid 服务器 12.0.0.10
web1 服务器 12.0.0.13
web2 服务器 12.0.0.7
客户机win10 12.0.0.15
搭建传统代理
部署squid服务器
- 先搭建squid服务器,先解压包,然后执行再编译
[root@localhost ~]# tar xf squid-3.5.27.tar.gz
[root@localhost ~]# cd squid-3.5.27/
[root@localhost squid-3.5.27]# ./configure --prefix=/usr/local/squid --sysconfdir=/etc --enable-arp-acl --enable-linux-netfilter --enable-linux-tproxy --enable-async-io=100 --enable-err-language="Simplify_Chinese" --enable-underscore --enable-poll --enable-gnuregex
[root@localhost squid-3.5.27]# make && make install
./configure --prefix=/usr/local/squid //安装目录
--sysconfdir=/etc/ //单独将配置文件修改到/etc目录下
--enable-arp-acl //可在ACL中设置通过MAC地址进行管理,防止IP欺骗
--enable-linux-netfilter //使用内核过滤
--enable-linux-tproxy //支持透明模式
--enable-async-io=100 //异步I/O,提升储存性能,值可修改
--enable-err-language="Simplify_Chinese" //错误信息的显示语言
--enable-underscore //允许URL中有下划线
--enable-poll //使用Poll()模式,提升性能
--enable-gnuregex //使用GNU正则表达式
- 优化一下路径
[root@localhost squid-3.5.27]# ln -s /usr/local/squid/sbin/* /usr/local/sbin
- 创建管理用户
[root@localhost squid-3.5.27]# useradd -M -s /sbin/nologin squid
- 将var目录赋属主属组
[root@localhost squid-3.5.27]# chown -R squid:squid /usr/local/squid/var/
- 修改squid配置文件
vim /etc/squid.conf
# And finally deny all other access to this proxy
56 http_access allow all //放在http_access deny all 之前,允许任意客户机使用代理服务,控制规则自上而下匹配
57 http_access deny all
58 http_port 3128 //用来指定代理服务监听的地址和端口(默认的端口号为3128)
62 #cache_dir ufs /usr/local/squid/var/cache/squid 100 16 256
63 cache_effective_user squid //添加,指定程序用户,用来设置初始化、运行时缓存的账号,否则启动不成功
64 cache_effective_group squid //添加,指定账号基本组
65 cache_mem 64 MB //指定缓存功能所使用的内存空间大小,便于保存访问较频繁的WEB对象,容量最好为4的倍数,单位为MB,建议设为物理内存的1/4
66 reply_body_max_size 10 MB //允许用户下载的最大文件大小,以字节为单位,当下载超过指定大小的Web对象时,浏览器的报错页面中会出现“请求或访问太大”的提示默认设置0表示不进行限制
67 maximum_object_size 4096 KB //允许保存到缓存空间的最大对象大小,以KB为单位,超过大小限制的文件将不被缓存,而是直接转发给用户
68 coredump_dir /usr/local/squid/var/cache/squid //指定缓存文件目录
- 编写squid脚本
#!/bin/bash
#chkconfig: 35 90 25
#config: /etc/squid.conf
#pidfile: /usr/local/squid/var/run/squid.pid
#Description: Squid - Internet Object Cache
PID="/usr/local/squid/var/run/squid.pid"
CONF="/etc/squid.conf"
CMD="/usr/local/squid/sbin/squid"
case "$1" in
start)
netstat -utpln | grep squid &>/dev/null
if [ $? -eq 0 ]
then
echo "Squid is running"
else
$CMD
fi
;;
stop)
$CMD -k kill &>/dev/null
rm -rf $PID &>/dev/null
;;
status)
[ -f $PID ] &>/dev/null
if [ $? -eq 0 ]
then
netstat -utpln | grep squid
else
echo "Squid is not running"
fi
;;
restart)
$0 stop &>/dev/null
echo "正在关闭Squid..."
$0 start &>/dev/null
echo "正在启动Squid..."
;;
reload)
$CMD -k reconfigure
;;
check)
$CMD -k parse
;;
*)
echo "用法:{start | stop | restart | reload | check | status}"
esac
- 然后赋权脚本并加入系统中,然后启动服务
[root@localhost squid-3.5.27]# chmod +x /etc/init.d/squid
[root@localhost squid-3.5.27]# chkconfig --add squid
[root@localhost squid-3.5.27]# chkconfig squid on
[root@localhost squid-3.5.27]# service squid restart
正在关闭Squid...
正在启动Squid...
- 然后检查配置,并重新加载,然后初始化再运行
[root@localhost squid-3.5.27]# squid -k parse
[root@localhost squid-3.5.27]# squid –k rec
[root@localhost squid-3.5.27]#squid -zX
[root@localhost squid-3.5.27]# squid
[root@localhost squid-3.5.27]# netstat -antp | grep squid
tcp6 0 0 :::3128 :::* LISTEN 43693/(squid-1)
注:这一步需要主机名与配置文件中的http_access allow localhost保持一致,不然会报错
- 然后去写一条防火墙规则
[root@localhost squid-3.5.27]# iptables -F
[root@localhost squid-3.5.27]# iptables -A INPUT -p tcp --dport 3128 -i ACCEPT //接受入站的tcp包访问3128端口
部署web服务器
- 安装httpd服务并启动
[root@web1 ~]# systemctl start httpd
root@web1 ~]# netstat -antp | grep httpd
tcp6 0 0 :::80 :::* LISTEN 78583/httpd
- 在win10上设置代理服务
- - 然后访问web1的ip
- 然后在web1上的访问日志能看到是代理服务器的ip地址
搭建透明搭理
实验环境
Squid 服务器 ens33 :12.0.0.10/8 ens37 192.168.1.3/24(win10的网关)
web1 服务器 12.0.0.13/8
web2 服务器 12.0.0.7/8
win10 192.168.1.101 网关为192.168.1.3
部署squid服务器
- 先修改squid配置
[root@www ~]# vim /etc/squid.conf
http_port 192.168.1.3:3128 transparent //添加提供内网服务的IP地址,和支持透明代理选项 transparent
- 然后重启并修改系统配置使得支持路由转发
[root@www ~]# systemctl restart squid
[root@www ~]# vim /etc/sysctl.conf
net.ipv4.ip_forward = 1 //支持路由转发
- 然后配置防火墙规则
[root@www ~]# iptables -F
[root@www ~]# iptables -t nat -F //先清除原有的策略
[root@www ~]# iptables -t nat -I PREROUTING -i ens37 -s 192.168.1.0/24 -p tcp --dport 80 -j REDIRECT --to 3128 //使得nat模式的在路由转发之前将ens37网卡进来的tcp的1.0网段的路由从80重定向给3128端口
[root@www ~]# iptables -t nat -I PREROUTING -i ens37 -s 192.168.1.0/24 -p tcp --dport 443 -j REDIRECT --to 3128 //同样将443的流量重定向到3128端口
- 在web写一条路由指向1.0网段,使得可以通信
route add -net 192.168.1.0/24 gw 12.0.0.10 //去往1.0网段的路由,下一跳是12.0.0.10
- 这时web端开启httpd服务,win10客户端就可以访问主页了
- 而web端的访问日志显示的是12.0.0.10来源,说明代理成功
搭建反向代理
反向代理的用处
- 缓存网页对象,减少重复的请求
- 将互联网请求轮询或按权重分配到内网web服务器
- 代理用户请求,避免用户直接访问web服务器,提高安全性
部署squid服务器
- 先清除所有的防火墙规则
iptables -F
iptables -t nat -F
- 修改squid配置
[root@www ~]# vim /etc/squid.conf
# Squid normally listens to port 3128
http_port 12.0.0.10:80 accel vhost vport
cache_peer 12.0.0.7 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
cache_peer 12.0.0.13 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2
cache_peer_domain web1 web2 www.taobao.com
//accel :反向代理加速模式
//vhost:支持域名或主机名来表示代理节点
//vport :支持IP和端口来表示代理节点
//parent :代表为父节点,上下关系,非平级关系
//80:代理内部web服务器的80端口
//0 :没有使用tcp,表示就一台squid服务器
//no-query :不做查询操作,直接获取数据
//originserver :指定是源服务器
//round-robin :指定squid通过轮询方式将请求分发到其中一台父节点
//max_conn :指定最大连接数
//weight :指定权重
//name :设置别名
部署web
- 开启httpd服务并设置主页
[root@web1 ~]# echo "this is 1" > /var/www/html/index.html
[root@web1 ~]# systemctl restart httpd
[root@web2 ~]# echo "this is 2" > /var/www/html/index.html
[root@web2 ~]# systemctl restart httpd
部署客户端
- 指定代理ip
- 为了快速访问在本地添加映射
- 然后访问域名,发现可以轮询
- 再看两个web的访问日志,发现都有日志,实验成功
通过ACL控制访问
-
使用acl定义需要控制的条件
-
通过http_access配置项对已定义的列表做“允许”或“拒绝”访问的控制
-
格式:acl 列表名称 列表类型 列表内容,例如:
-
可写参数
[root@www ~]# vim /etc/squid.conf
# should be allowed
acl host src 192.168.1.101/24 //源地址是192.168.1.101
acl MYLAN src 192.168.1.0/24 //客户机网段
acl destinationhost dst 192.168.226.129/32 //目标地址为192.168.184.20
acl MC20 maxconn 20 //最大并发连接20
acl PORT port 21 //目标端口21
acl DMBLOCK dstdomain .qq.com //目标域,匹配域内所有站点
acl BURL url_regex -i ^rtsp:// ^emule:// //以rtsp://. emule://开头的URL,-i表示忽略大小写
acl PURL urlpath_regex -i \.mp3$ \.mp4$ \.rmvb$ //以 .mp3、.mp4、.rmvb结尾的URL路径
acl WORKTIME time MTWHF 08:30-17:30 //时间为周一-至周五8:30~17:30, "MTWHF"为每个星期的英文首字母
- 我们简单控制只需要写第一条或者第二条,此时用客户机访问,发现squid把他拦截了,所以acl成功
在这里插入代码片
Squid的日志分析
- 日志分析用一个sarg工具来实现
- sarg采用HTML格式,详细列出每一位用户访问Internet的站点信息、时间占用信息、排名、连接次数、访问量等
部署squid
- 先下载图像处理软件包
[root@www ~]# yum install -y gd gd-devel pcre-devel
- 然后安装sarg,执行并编译
[root@www ~]# tar zxvf sarg-2.3.7.tar.gz
[root@www ~]# cd /opt/sarg-2.3.7
[root@www sarg-2.3.7]# ./configure --prefix=/usr/local/sarg --sysconfdir=/etc/sarg --enable-extraprotection
[root@www sarg-2.3.7]# make && make install
- 开始修改sarg配置文件
vim /etc/sarg/sarg.conf
--7行--取消注释
access_log /usr/local/squid/var/logs/access.log //指定访问日志文件
--25行--取消注释
title "Squid User Access Reports" //网页标题
--120行--取消注释,修改
output_dir /var/www/html/sarg //报告输出目录
--178行--取消注释
user_ip no //使用用户名显示
--184行--取消注释,修改
topuser_sort_field connect reverse //top排序中,指定连接次数采用降序排列,升序是normal
--190行--取消注释,修改
user_sort_field connect reverse //对于用户访问记录,连接次数按降序排序
--206行--取消注释,修改
exclude_hosts /usr/local/sarg/noreport //指定不计入排序的站点列表的文件
--257行--取消注释
overwrite_report no //同名同日期的日志是否覆盖
--289行--取消注释,修改
mail_utility mailq.postfix //发送邮件报告命令
--434行--取消注释,修改
charset UTF-8 //指定字符集UTF-8
--518行--取消注释
weekdays 0-6 //top排行的星期周期
--525行--取消注释
hours 0-23 //top排行的时间周期
--633行--取消注释
www_document_root /var/www/html //指定网页根目录
- 添加不计入站点文件,添加的域名将不被显示在排序中
[root@www sarg-2.3.7]# touch /usr/local/sarg/noreport
- 将启动命令设置快捷方式
ln -s /usr/local/sarg/bin/sarg /usr/local/bin/
- 然后启动
[root@www sarg-2.3.7]# sarg
SARG: 纪录在文件: 2084, reading: 100.00%
SARG: 成功的生成报告在 /var/www/html/sarg/2021Jul28-2021Jul30
- 在squid服务器上安装httpd服务并启动,因为端口有占用所以先暂停squid
[root@www sarg-2.3.7]# systemctl stop squid
[root@www sarg-2.3.7]# systemctl start httpd
- 在客户机上查看浏览器访问 http://192.168.226.128/sarg,查看sarg报告网页
- 然后设置每日任务,先写一个执行脚本,再写一个计划任务
[root@www sarg-2.3.7]# vim /usr/local/sarg/report.sh
#!/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#Get one week ago today
YESTERDAY=$(date -d "1 day ago" +%d/%m/%Y)
/usr/local/sarg/bin/sarg -l /usr/local/squid/var/logs/access.log -o /var/www/html/sarg -z -d $YESTERDAY-$TODAY &> /dev/null
exit 0
[root@www sarg-2.3.7]# chmod +x /usr/local/sarg/report.sh
[root@www sarg-2.3.7]# crontab -l
0 0 * * * /usr/local/sarg/report.sh //每天0点执行一次脚本
小结
squid 会有三种模式:
- ①传统代理(需要指向squid)
需要客户端指向squid 代理服务器,客户端能感知到squid 代理服务器的存在 - ②透明代理(常用,不需要指向squid)
客户端不需要配置,只要直接访问即可,服务端,借助了防火墙规则及静态路由的方式,完成透明代理 - ③反向代理(需要指向squid)
做为类似与Nginx服务器的反向代理功能,但自身不需要一个首页,基于虚拟的IP:端口、以及虚拟的域名进行反向代理给后端真实服务器的IP:端口,并且以权重的方式完成反向代理
对于Squid 自身的管理
- ACL:主要做的是http_access(基于http协议,access访问)的允许和拒绝管理
- sarg:日志分析功能,可以以天的方式指定将access_log中的内容输出到一个web页面中(借助了httpd)展示出来。