目录
引言
Squid是Linux系统中最常用的一款开源代理服务软件,可以很好地实现HTTP和FTP,以及DNS查询、SSL等应用的缓存代理,功能十分强大。
一、Squid代理服务器
Squid主要提供缓存加速、应用层过滤控制的功能。
1、代理的工作机制
(1)代替客户机向网站请求数据,从而可以隐藏用户的真实IP地址。
(2)将获得的网页数据(静态Web元素)保存到缓存中并发送给客户机,以便下次请求相同的数据时快速响应。
(3)Web代理的工作机制,缓存网页对象,减少重复请求
Squid是一个缓存Internet数据的一个软件,它接收用户的下载申请,并自动处理所下载的数据。也就是说,当一个用户想要下载一个主页时,它向Squid发出一个申请,要Squid替它下载,然后Squid 连接所申请网站并请求该主页,接着把该主页传给用户同时保留一个备份,当别的用户申请同样的页面时,Squid把保存的备份立即传给用户,减少了向Internet提交重复的Web请求的过程,提高了用户下载网页的速度,隐藏了客户机的真实IP,如下图所示
2、代理的类型
(1)传统代理:适用于Internet,需在客户机指定代理服务器的地址和端口。
(2)透明代理:客户机不需指定代理服务器的地址和端口,而是通过默认路由、防火墙策略将Web访问重定向给代理服务器处理。
(3)反向代理:如果Squid反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 WEB 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存(静态)在本地,供下一个请求者使用。
3、使用代理的好处
(1)提高Web访问速度
(2)隐藏客户机的真实IP地址
二、Squid代理安装步骤
1、安装依赖环境
[root@squid ~]# yum -y install gcc gcc-c++ make
[root@squid ~]# cd /opt/
[root@squid opt]# tar xvf squid-3.5.28.tar.gz
[root@squid opt]# cd squid-3.5.28/
[root@squid squid-3.5.28]# ./configure --prefix=/usr/local/squid --sysconfdir=/etc --enable-arp-acl --enable-linux-netfilter --enable-linux-tproxy --enable-async-io=100 --enable-err-language="Simplify_Chinese" --enable-underscore --enable-poll --enable-gnuregex
脚本 | 含义 |
./configure --prefix=/usr/local/squid | 安装目录 |
--sysconfdir=/etc/ | 单独将配置文件修改到/etc目录下 |
--enable-arp-acl | 可在ACL中设置通过MAC地址进行管理,防止IP欺骗 |
--enable-linux-netfilter | 使用内核过滤 |
--enable-linux-tproxy | 支持透明模式 |
--enable-async-io=100 | 异步I/O,提升储存性能,值可修改 |
--enable-err-language="Simplify_Chinese" | 错误信息的显示语言 |
--enable-underscore | 允许URL中有下划线 |
--enable-poll | 使用Poll()模式,提升性能 |
--enable-gnuregex | 使用GNU正则表达式 |
[root@squid squid-3.5.28]# make -j 6 && make install
[root@squid squid-3.5.28]# ln -s /usr/local/squid/sbin/* /usr/local/sbin #创建链接文件,优化路径
[root@squid squid-3.5.28]# useradd -M -s /sbin/nologin squid #创建程序用户、组
[root@squid squid-3.5.28]# chown -R squid:squid /usr/local/squid/var/ #改变目录属主
2、修改Squid的配置文件
[root@squid ~]# vim /etc/squid.conf #放在http_access deny all 之前,允许任意客户机使用代理服务,控制规则自上而下匹配
-----56行--插入------
http_access allow all #放在http_access deny all 之前,允许任意客户机使用代理服务,控制规则自上而下匹配
http_access deny all
http_port 3128 #用来指定代理服务监听的地址和端口(默认的端口号为3128)
-----66行--插入------
cache_effective_user squid #添加,指定程序用户,用来设置初始化、运行时缓存的账号,否则启动不成功
cache_effective_group squid #添加,指定账号基本组
coredump_dir /usr/local/squid/var/cache/squid #指定缓存文件目录
[root@squid ~]# squid -k parse #检查配置文件
[root@squid ~]# squid –k rec
[root@squid ~]# squid -zX
[root@squid ~]# squid
[root@squid ~]# netstat -anpt | grep squid
tcp6 0 0 :::3128 :::* LISTEN 118521/(squid-1)
3、编写Squid服务脚本
[root@squid ~]# vim /etc/init.d/squid
#!/bin/bash
#chkconfig: 35 90 25
#config: /etc/squid.conf
#pidfile: /usr/local/squid/var/run/squid.pid
#Description: Squid - Internet Object Cache
PID="/usr/local/squid/var/run/squid.pid"
CONF="/etc/squid.conf"
CMD="/usr/local/squid/sbin/squid"
case "$1" in
start)
netstat -utpln | grep squid &>/dev/null
if [ $? -eq 0 ]
then
echo "Squid is running"
else
$CMD
fi
;;
stop)
$CMD -k kill &>/dev/null
rm -rf $PID &>/dev/null
;;
status)
[ -f $PID ] &>/dev/null
if [ $? -eq 0 ]
then
netstat -utpln | grep squid
else
echo "Squid is not running"
fi
;;
restart)
$0 stop &>/dev/null
echo "正在关闭Squid..."
$0 start &>/dev/null
echo "正在启动Squid..."
;;
reload)
$CMD -k reconfigure
;;
check)
$CMD -k parse
;;
*)
echo "用法:{start | stop | restart | reload | check | status}"
esac
[root@squid ~]# chmod +x /etc/init.d/squid
[root@squid ~]# chkconfig --add squid
[root@squid ~]# chkconfig squid on
[root@squid ~]# service squid restart
正在关闭Squid...
正在启动Squid...
三、搭建代理步骤
搭建环境 | |
服务器 | IP地址 |
Squid代理服务器 | ens33:192.168.100.100;ens37:10.0.0.100 |
Web服务器 | ens33:10.0.0.10 |
客户机 | 192.168.100.10 |
1、搭建传统代理
如上图所示,在服务器B上构建Squid代理服务器,允许客户机指定squid代理服务器作为Web代理,访问网站服务器,但禁止通过代理下载超过10MB的文件,超过4MB的文件不进行缓存。
(1)Squid服务器配置
[root@squid ~]# vim /etc/squid.conf
#64行插入
cache_mem 64 MB #指定缓存功能所使用的内存空间大小,便于保持访问较频繁的WEB对象,容量最好为4的倍数,单位为MB,建议设为物理内存的1/4
reply_body_max_size 10 MB #允许用户下载的最大文件大小,以字节为单位,当下载超过指定大小的Web对象时,浏览器的报错页面中会出现“请求或访问太大”的提示默认设置0表示不进行限制
maximum_object_size 4096 KB #允许保存到缓存空间的最大对象大小,以KB为单位,超过大小限制的文件将不被缓存,而是直接转发给用户
[root@squid ~]# service squid restart
正在关闭Squid...
正在启动Squid...
[root@squid ~]# systemctl restart squid
[root@squid ~]# iptables -F #修改防火墙规则
[root@squid ~]# iptables -I INPUT -p tcp --dport 3128 -j ACCEPT
(2)Web服务器配置
[root@web ~]# systemctl stop firewalld.service
[root@web ~]# systemctl disable firewalld.service
[root@web ~]# setenforce 0
[root@web ~]# yum -y install httpd
[root@web ~]# systemctl start httpd
[root@web ~]# netstat -natp | grep 80
(3)客户端配(添加代理)
①谷歌浏览器:设置→高级→系统→打开代理设置→设置代理
②客户机访问Web的ip
③Web服务器查看访问日志信息
[root@web ~]# tail -f /var/log/httpd/access_log
2、搭建透明代理
透明代理提供的服务功能与传统代理是一致的,但是其“透明”的实现依赖于默认路由和防火墙的重定向策略,因此更适用于为局域网主机服务,而不适合为Internet中的客户机提供服务。在Linux网关上,构建Squid为客户机访问Internet提供代理服务。在所有的局域网客户机上,只需正确设置IP地址、默认网关和DNS,不需要手动指定代理服务器的地址、端口等信息。
(1)Squid服务器配置
[root@squid ~]# vim /etc/squid.conf
http_access allow all
http_access deny all
http_port 192.168.100.100:3128 transparent #修改添加提供内网服务的IP地址,和支持透明代理选项transparent
[root@squid ~]# systemctl restart squid
[root@squid ~]# echo 'net.ipv4.ip_forward = 1' >> /etc/sysctl.conf
[root@squid ~]# sysctl -p
net.ipv4.ip_forward = 1
[root@squid ~]# iptables -F
[root@squid ~]# iptables -t nat -F
[root@squid ~]# iptables -t nat -I PREROUTING -i ens33 -s 192.168.100.0/24 -p tcp --dport 80 -j REDIRECT --to 3128
[root@squid ~]# iptables -t nat -I PREROUTING -i ens33 -s 192.168.100.0/24 -p tcp --dport 443 -j REDIRECT --to 3128
[root@squid ~]# iptables -I INPUT -p tcp --dport 3128 -j ACCEPT
(2)验证
①客户机访问Web的ip
②Web服务器查看访问日志信息
[root@web ~]# tail -f /var/log/httpd/access_log
3、ACL访问控制
在配置文件squid.conf 中,ACL访问控制通过以下两个步骤来实现:使用acl 配置项定义需要控制的条件;通过http_access配置项对已定义的列表做“允许”或“拒绝”访问的控制。
定义访问控制列表
格式:
acl 列表名称 列表类型 列表内容
列表名称:名称自定义,相当于给acl起个名字(有点类似于shell脚本变量名)
列表类型:必须使用squid预定义的值,对应不同类别的控制条件
列表内容:是要控制的具体对象,不同类型的列表所对应的内容也不一样,可以有多个值(以空格为分隔,为“或”的关系)
方法①:
vim /etc/squid.conf
......
acl localhost src 192.168.100.10/32 #源地址为 192.168.100.10
acl MYLAN src 192.168.100.0/24 #客户机网段
acl destionhost dst 192.168.100.100/32 #目标地址为 192.168.100.100
acl MC20 maxconn 20 #最大并发连接 20
acl PORT port 21 #目标端口 21
acl DMBLOCK dstdomain .qq.com #目标域,匹配域内所有站点
acl BURL url_regex -i ^rtsp:// ^emule:// #以 rtsp://、emule:// 开头的 URL,-i表示忽略大小写
acl PURL urlpath_regex -i \.mp3$ \.mp4$ \.rmvb$ #以 .mp3、.mp4、.rmvb 结尾的 URL 路径
acl WORKTIME time MTWHF 08:30-17:30 #时间为周一至周五 8:30~17:30,“MTWHF”为每个星期的英文首字母
方法②:
#建立目标 IP 地址名单
vim ipblock.list
10.0.0.10 #添加要拒绝的服务器ip
修改squid配置文件
vim /etc/squid.conf
....
# should be allowed (此行下面添加)
acl destionhost dst "/dest.list"
....
# Deny requests to certain unsafe ports (此行下面添加)
http_access deny destionhost
...
# Squid normally listens to port 3128
http_port 3128 #修改为3128端口
重启服务并查看是否开启
systemctl restart squid.service
netstat -natp | grep 3128
4、Squid 日志分析
SARG全称是Squid Analysis Report Generator,是一款Squid日志分析工具,采用HTML格式,详细列出每位用户访问Internet的站点信息、时间占用信息、排名、连接次数、访问量等。
(1)安装 GD 库
[root@squid ~]# yum -y install gd gd-devel pcre-devel
安装 SARG
[root@squid ~]# mkdir /usr/local/sarg
[root@squid ~]# cd /opt/
[root@squid opt]# tar zxf sarg-2.3.7.tar.gz
[root@squid opt]# cd sarg-2.3.7/
##--sysconfdir=/etc/sarg: 配置文件目录,默认是/usr/loca/etc
##--enable-extraprotection: 添加额外的安全保护
[root@squid sarg-2.3.7]# ./configure --prefix=/usr/local/sarg --sysconfdir=/etc/sarg --enable-extraprotection
[root@squid sarg-2.3.7]# make && make install
(2)修改sarg配置文件
[root@squid sarg-2.3.7]# vim /etc/sarg/sarg.conf
#第7行取消注释
access_log /usr/local/squid/var/logs/access.log #指定访问日志文件
#第25行取消注释
title "Squid User Access Reports" #网页标题
#第120行取消注释
output_dir /var/www/html/sarg #报告输出目录
#第178行取消注释
user_ip no #使用用户名显示
#第184行取消注释并修改
topuser_sort_field connect reverse #top排序中,指定连接次数采用降序排列,升序是normal
#第190行取消注释并修改
user_sort_field connect reverse #对于用户访问记录,连接次数按降序排序
#第206行取消注释并修改
exclude_hosts /usr/local/sarg/noreport #指定不计入排序的站点列表的文件
#第257行取消注释
overwrite_report no #同名同日期的日志是否覆盖
#第289行取消注释并修改
mail_utility mailq.postfix #发送邮件报告命令
#第434行取消注释并修改
charset UTF-8 #指定字符集UTF-8
#第518行取消注释
weekdays 0-6 #top排行的星期周期
#第525行取消注释
hours 0-23 #top排行的时间周期
#第633行取消注释
www_document_root /var/www/html #指定网页根目录
(3)添加不加入站点文件
[root@squid sarg-2.3.7]# touch /usr/local/sarg/noreport
[root@squid sarg-2.3.7]# ln -s /usr/local/sarg/bin/sarg /usr/local/bin/
[root@squid sarg-2.3.7]# sarg
SARG: 纪录在文件: 1457, reading: 100.00%
SARG: 成功的生成报告在 /var/www/html/sarg/2021Nov03-2021Nov04
(4)添加计划任务,执行每天生成报告
[root@squid ~]# vim /usr/local/sarg/report.sh
#!/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#get one week ago today
YESTERDAY=$(date -d "1 day ago" +%d/%m/%Y)
/usr/local/sarg/bin/sarg -l /usr/local/squid/var/logs/access.log -o /var/www/html/sarg -z -d $YESTERDAY-$TODAY &> /dev/null
exit 0
[root@squid ~]# chmod +x /usr/local/sarg/report.sh
[root@squid ~]# crontab -e
0 1 * * * /usr/local/sarg/report.sh
(5)浏览器中访问squid服务器测试
5、搭建反向代理
如果Squid反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的Web服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。
(1)工作机制
缓存网页对象,减少重复请求;
将互联网请求轮询或按权重分配到内网web服务器;
代理用户请求,避免用户直接访问Web服务器,提高安全。
(2)配置iptables规则
[root@squid ~]# iptables -F
[root@squid ~]# iptables -t nat -F
[root@squid ~]# iptables -I INPUT -p tcp --dport 3128 -j ACCEPT
(3)修改squid配置文件
[root@squid ~]# vim /etc/squid.conf
http_port 192.168.100.100:80 accel vhost vport
cache_peer 10.0.0.10 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
cache_peer 10.0.0.20 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2
cache_peer_domain web1 web2 www.qaz.com
####关键字解释如下####
http port 80 accel vhost vport
#squid从一个缓存变成了一个Web服务器反向代理加速模式,这个时候squid在80端口监听请求,
同时和webserver的请求端口(vhost vport)绑定,这个时候请求到了squid, squid是不用转发请求的,
而是直接要么从缓存中拿数据要么向绑定的端口直接请求数据。
accel:反向代理加速模式
vhost:支持域名或主机名来表示代理节点
vport :支持IP和端口来表示代理节点
parent :代表为父节点,上下关系,非平级关系
80:代理内部web服务器的80端口
0 :没有使用icp, 表示就一台squid服务器
no-query :不做查询操作,直接获取数据
originserver :指定是源服务器
round- robin : 指定squid通过轮询方式将请求分发到其中一台父节点
maxconn:指定最大连接数
weight :指定权重
name:设置别名
[root@squid ~]# systemctl stop squid
[root@squid ~]# systemctl start squid
(4)配置Web1和Web2
#节点1(Web1):
echo "this is Web1" >> /var/www/html/index.html
#节点2(Web2):
echo "this is Web1" >> /var/www/html/index.html
(5)客户机的域名映射配置
修改C:\Windows\System32\drivers\etc\hosts 文件
10.0.0.10 10.0.0.20 www.qaz.com
(6)测试
总结
1、Squid作用:缓存加速,缓存从后端web服务器获取到的,加速为了客户端访问
2、Squid的三种模式:
(1)传统模式
需要客户端指向squid代理服务器,客户端能感知到squid代理服务器的存在;修改的配置文件:squid.conf设置3128端口、缓存和允许下载的大小。
(2)透明代理
客户端不需要配置,只要直接访问即可,服务端开启路转发,借助了防护墙规则及静态路由的方式,完成透明代理;修改的配置文件:squid.conf设置ip和3128端口;需要设置iptables的流量重定向,将指定网卡网段的流量重定向到3128端口。
(3)反向代理
作为类似于nginx服务器的反向代理功能,但自身不需要一个首页,基于ip:端口。权重的方式完成反向代理;修改的配置文件:squid.conf设置端口为80;服务端需要开启客户机的代理配置。
3、对应Squid自身的管理/功能:
(1)ACL:主要做的是http_access(基于http协议,access访问)的允许和拒绝管理
使用acl配置项定义需要控制的条件;通过http_access配置项对已定义的列表做“允许”或“拒绝”访问的控制。
(2)Sarg:日志分析功能,可以以天的方式指定将access_log中的内容输出到一个web页面中(借助了httpd)展示出来。
借助SARG日志分析工具实现;编写脚本并加入计划性任务可实现每日自动生成报告。