Squid代理服务器应用


Squid主要提供缓存加速、应用层过滤控制的功能

一、Squid代理服务器

工作机制

  1. 代替客户机向网站请求数据,从而可以隐藏用户的真实IP地址
  2. 将获得的网页数据(静态web元素)保存到缓存中并发送给客户机,以便下次请求相同的数据时快速响应

代理服务器的概念

代理服务器是一个位于客户端和原始(资源)服务器之间的服务器,为了从原始服务器取得内容,客户端向代理服务器发送一个请求并指定目标原始服务器,然后代理服务器向原始服务器转交请求并获得的内容返回给客户端
缓存带对于web至关重要,尤其对于大型高负载web站点。缓存可作为性能优化的一个重要手段,可以极大减轻后端服务器的负载。通常对于静态资源,即较少经常更新的资源,如图片,css或js等进行缓存,从而在每次刷新浏览器的时候,不用重新请求,而是从缓存里面读取,这样就可以减轻服务器的压力。

作用

其主要作用有:
资源获取:代替客户端实现从原始服务器的资源获取;
加速访问:代理服务器可能离原始服务器更近,从而起到一定的加速作用;
缓存作用:代理服务器保存从原始服务器所获取的资源,从而实现客户端快速的获取;
隐藏真实地址:代理服务器代替客户端去获取原始服务器资源,从而隐藏客户端真实信息。

类型

常用的代理服务:
Squid 、Nginx 、 Varnish、 CDN

squid代理的类型:
传统代理:适用于Internet 正向代理,需在客户机指定代理服务器的地址和端口。

透明代理:客户机不需指定代理服务器的地址和端口,而是通过默认路由、防火墙策略将Web访问重定向给代理服务器处理。

反向代理:如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 WEB 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。

二、安装Squid服务

1.编译安装 Squid
yum -y install gcc gcc-c++ make
tar zxvf squid-3.5.28.tar.gz -C /opt/
cd /opt/squid-3.5.28
./configure --prefix=/usr/local/squid
–sysconfdir=/etc
–enable-arp-acl
–enable-linux-netfilter
–enable-linux-tproxy
–enable-async-io=100
–enable-err-language=“Simplify_Chinese”
–enable-underscore
–disable-poll
–enable-epoll
–enable-gnuregex

–prefix=/usr/local/squid \ #指定安装目录路径
–sysconfdir=/etc \ #指定配置文件路径
–enable-arp-acl \ #MAC地址管控,防止客户端使用IP欺骗
–enable-linux-netfilter \ #使用内核过滤
–enable-linux-tproxy \ #支持透明模式
–enable-async-io=100 \ #异步IO,提升存储性能
–enable-err-language=“Simplify_Chinese” \ #错误信息的显示语言
–enable-underscore \ #允许URL中有下划线
–disable-poll \ #关闭默认使用 poll 模式
–enable-epoll \ #开启epoll模式提升性能
–enable-gnuregex #使用GNU正则表达式

编译及安装
make && make install
建立软连接
ln -s /usr/local/squid/sbin/* /usr/local/sbin/
创建系统用户
useradd -M -s /sbin/nologin squid
修改目录权限
chown -R squid:squid /usr/local/squid/var/ #此目录用于存放缓存文件

2.修改 Squid 的配置文件
vim /etc/squid.conf
在这里插入图片描述
在这里插入图片描述
3.Squid 的运行控制
#检查配置文件语法是否正确
squid -k parse

#启动 Squid,第一次启动 Squid 服务时,会自动初始化缓存目录
squid -z #-z 选项用来初始化缓存目录
squid #启动 squid 服务

4.创建 Squid 服务脚本
vim /etc/init.d/squid
在这里插入图片描述
#2345是默认自启动级别,如是-代表任何级别都不自启动;90是启动优先级,25是停止优先级,优先级范围是0-100,数字越大,优先级越低。
chmod +x /etc/init.d/squid
chkconfig --add squid
chkconfig --level 35 squid on
接下来就可以使用systemctl来管理服务了

三、构建传统代理服务器

vim /etc/squid.conf
在这里插入图片描述
cache_mem 64 MB #指定缓存功能所使用的内存空间大小,便于保持访问较频繁的WEB对象,容量最好为4的倍数,单位为MB,一般设为物理内存的1/3
cache_swap_high 95 #cache目录使用量大于95%时,开始清理旧的cache
cache_swap_low 90 #cache目录清理到90%时停止

reply_body_max_size 100 MB #允许用户下载的最大文件大小,以字节为单位,当下载超过指定大小的Web对象时,浏览器的报错页面中会出现“请求或访问太大”的提示默认设置0表示不进行限制
maximum_object_size 512000 KB #设置squid磁盘缓存最大文件,以KB为单位,超过的文件不保存到硬盘,而是直接转发给用户
maximum_object_size_in_memory 512 KB #设置squid内存缓存最大文件,超过的文件不保存到内存
minimum_object_size 0 KB 设置squid磁盘缓存最小文件

重启squid服务

注意:在生产环境中需要修改防火墙规则
iptables -F
iptables -I INPUT -p tcp --dport 3128 -j ACCEPT
#客户机的代理配置
打开浏览器,工具–>Internet选项–>连接–>局域网设置–>开启代理服务器(地址:Squid服务器IP地址,端口:3128)

#查看 Squid 访问日志的新增记录中的缓存命中情况
tail -f /usr/local/squid/var/logs/access.log
TCP_MEM_HIT/200

#查看 Web 访问日志的新增记录
tail -f /var/log/httpd/access_log
在浏览器输入Web服务器IP地址访问,查看Web服务器访问日志,显示的是由代理服务器替客户机在访问。
在这里插入图片描述

四、构建透明代理服务器

Squid服务器:双网卡,内网ens33:192.168.136.51 外网ens35:12.0.0.30
Web 服务器:12.0.0.100
客户机:192.168.136.100

Squid服务器配置
vim /etc/squid.conf

http_access allow all
http_access deny all
–60行–修改添加提供内网服务的IP地址,和支持透明代理选项 transparent
http_port 192.168.80.10:3128 transparent

systemctl restart squid

开启路由转发,实现本机中不同网段的地址转发
echo ‘net.ipv4.ip_forward = 1’ >> /etc/sysctl.conf
sysctl -p

修改防火墙规则
iptables -F
iptables -t nat -F
iptables -t nat -I PREROUTING -i ens33 -s 192.168.80.0/24 -p tcp --dport 80 -j REDIRECT --to-ports 3128 #用于转发http协议
iptables -t nat -I PREROUTING -i ens33 -s 192.168.80.0/24 -p tcp --dport 443 -j REDIRECT --to 3128 #用于转发https协议
iptables -I INPUT -p tcp --dport 3128 -j ACCEPT

Web服务器配置
yum install -y httpd
systemctl start httpd
关闭客户机的浏览器之前设置的代理服务器的功能后访问 http://12.0.0.12

#查看 Squid 访问日志的新增记录
tail -f /usr/local/squid/var/logs/access.log
1631073624.552 0 192.168.80.200 TCP_MEM_HIT/200 449 GET http://12.0.0.12/ - HIER_NONE/- text/html

#查看 Web 访问日志的新增记录,显示的是由代理服务器的外网口代替客户机在访问
tail -f /var/log/httpd/access_log

在这里插入图片描述

五、访问控制列表

在配置文件 squid.conf 中,ACL 访问控制通过以下两个步骤来实现:
(1)使用 acl 配置项定义需要控制的条件;
(2)通过 http_access 配置项对已定义的列表做“允许”或“拒绝”访问的控制。

1.定义访问控制列表
格式:
acl 列表名称 列表类型 列表内容 …

vim /etc/squid.conf

acl localhost src 192.168.80.10/32 #源地址为 192.168.80.10
acl MYLAN src 192.168.80.0/24 192.168.1.0/24 #客户机网段
acl destinationhost dst 192.168.80.13/32 #目标地址为 192.168.80.13
acl MC20 maxconn 20 #最大并发连接 20
acl PORT port 21 #目标端口 21
acl DMBLOCK dstdomain .qq.com #目标域,匹配域内所有站点
acl BURL url_regex -i ^rtsp:// ^emule:// #以 rtsp://、emule:// 开头的目标 URL地址,-i表示忽略大小写
acl PURL urlpath_regex -i .mp3$ .mp4$ .rmvb$ #以 .mp3、.mp4、.rmvb 结尾的目标 URL 路径
acl WORKTIME time MTWHF 08:30-17:30 #时间为周一至周五 8:30~17:30,“MTWHF”为每个星期的英文首字母

启动对象列表管理

mkdir /etc/squid
vim /etc/squid/dest.list
192.168.80.13
192.168.1.0/24

vim /etc/squid.conf

acl destinationhost dst “/etc/squid/dest.list” #调用指定文件中的列表内容

http_access deny(或allow) destinationhost #注意,如果是拒绝列表,需要放在http_access allow all前面

systemctl restart squid

浏览器访问Web服务器 http://192.168.80.13 ,显示被访问被拒绝。

六、日志分析

#安装图像处理软件包
yum install -y pcre-devel gd gd-devel

mkdir /usr/local/sarg
tar zxvf sarg-2.3.7.tar.gz -C /opt/

cd /opt/sarg-2.3.7
./configure --prefix=/usr/local/sarg
–sysconfdir=/etc/sarg \ #配置文件目录,默认是/usr/local/etc
–enable-extraprotection #额外安全防护

vim /etc/sarg/sarg.conf
–7行–取消注释
access_log /usr/local/squid/var/logs/access.log #指定访问日志文件
–25行–取消注释
title “Squid User Access Reports” #网页标题
–120行–取消注释,修改
output_dir /var/www/html/sarg #报告输出目录
–178行–取消注释
user_ip no #使用用户名显示
–184行–取消注释,修改
topuser_sort_field connect reverse #top排序中,指定连接次数采用降序排列,升序是normal
–190行–取消注释,修改
user_sort_field connect reverse #对于用户访问记录,连接次数按降序排序
–206行–取消注释,修改
exclude_hosts /usr/local/sarg/noreport #指定不计入排序的站点列表的文件
–257行–取消注释
overwrite_report no #同名同日期的日志是否覆盖
–289行–取消注释,修改
mail_utility mailq.postfix #发送邮件报告命令
–434行–取消注释,修改
charset UTF-8 #指定字符集UTF-8
–518行–取消注释
weekdays 0-6 #top排行的星期周期
–525行–取消注释
hours 0-23 #top排行的时间周期
–633行–取消注释
www_document_root /var/www/html #指定网页根目录

#添加不计入站点文件,添加的域名将不被显示在排序中
touch /usr/local/sarg/noreport

ln -s /usr/local/sarg/bin/sarg /usr/local/bin/
sarg --help

#验证
yum install httpd -y
systemctl start httpd

#运行
sarg #启动一次记录

浏览器访问 http://192.168.80.10/sarg ,查看sarg报告网页。

#添加计划任务,执行每天生成报告
vim /usr/local/sarg/report.sh
#/bin/bash
#Get current date
TODAY=$(date +%d/%m/%Y)
#Get one week ago today
YESTERDAY=$(date -d “1 day ago” +%d/%m/%Y)
/usr/local/sarg/bin/sarg -l /usr/local/squid/var/logs/access.log -o /var/www/html/sarg -z -d Y E S T E R D A Y − YESTERDAY- YESTERDAYTODAY &> /dev/null
find ./ -type d -a -name “$(env LANG=en_US.UTF-8 date -d “30 day ago” +%Y%b%d)-$(env LANG=en_US.UTF-8 date -d “29 day ago” +%Y%b%d)” | xargs rm -rf
exit 0

chmod +x /usr/local/sarg/report.sh

crontab -e
0 0 * * * /usr/local/sarg/report.sh

七、Squid反向代理

如果 Squid 反向代理服务器中缓存了该请求的资源,则将该请求的资源直接返回给客户端;否则反向代理服务器将向后台的 Web 服务器请求资源,然后将请求的应答返回给客户端,同时也将该应答缓存在本地,供下一个请求者使用。

工作机制:
●缓存网页对象,减少重复请求
●将互联网请求轮训或按权重分配到内网Web服务器
●代理用户请求,避免用户直接访问Web服务器,提高安全

vim /etc/squid.conf
–60行–修改,插入
http_port 192.168.80.10:80 accel vhost vport
cache_peer 192.168.80.11 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web1
cache_peer 192.168.80.12 parent 80 0 no-query originserver round-robin max_conn=30 weight=1 name=web2
cache_peer_domain web1 web2 www.kgc.com
#表示对www.kgc.com的请求,squid向192.168.80.11和192.168.80.12的80端口发出请求

http_port 80 accel vhost vport #squid从一个缓存变成了一个Web服务器反向代理加速模式,这个时候squid在80端口监听请求,同时和web server的请求端口(vhost vport)绑定,这个时候请求到了squid,squid是不用转发请求的,而是直接要么从缓存中拿数据要么向绑定的端口直接请求数据。
accel :反向代理加速模式
vhost :支持域名或主机名来表示代理节点
vport :支持IP和端口来表示代理节点

parent :代表为父节点,上下关系,非平级关系
80 :代理内部web服务器的80端口
0 :没有使用icp(电信运营商),表示就一台squid服务器
no-query :不做查询操作,直接获取数据
originserver :指定是源服务器
round-robin :指定 squid 通过轮询方式将请求分发到其中一台父节点
max_conn :指定最大连接数
weight : 指定权重
name :设置别名

清空之前透明模式配置的 iptables 规则
iptables -F
iptables -t nat -F

systemctl stop httpd #防止 httpd 服务使用的 80 端口号和 squid 反向代理配置的监听端口冲突
systemctl restart squid

#后端节点服务器设置
yum install -y httpd
systemctl start httpd

#节点1:
echo “this is test01” >> /var/www/html/index.html
#节点2:
echo “this is test02” >> /var/www/html/index.html

#客户机的域名映射配置
修改 C:\Windows\System32\drivers\etc\hosts 文件
192.168.80.10 www.kgc.com

浏览器不开启代理访问 http://www.kgc.com

查看缓存命中情况
tailf /usr/local/squid/var/logs/access.log
1631164427.547 0 192.168.80.200 TCP_MEM_HIT/200 381 GET http://www.kgc.com/ - HIER_NONE/- text/html

八、Nginx缓存

http {
proxy_cache_path /data/nginx/cache levels=1:2 keys_zone=my_cache:10m max_size=10g inactive=60m use_temp_path=off;

#####################################################
●path:强制参数,指定缓存文件的存放路径。
●levels:定义了缓存目录的层级。每层可以用1(最多16种选择,0-f)或2(最多256种选择,00-ff)表示,中间用 : 分隔。
proxy_cache_path /data/nginx/cache; 代表所有缓存只有一个目录,比如/data/nginx/cache/d7b6e5978e3f042f52e875005925e51b
proxy_cache_path /data/nginx/cache levels=1:2; 代表缓存是二层目录(有16*256=4096个目录),比如/data/nginx/cache/b/51/d7b6e5978e3f042f52e875005925e51b
●keys_zone:强制参数,定义共享内存区的名称和大小,该共享内存用于保存缓存项目的元数据(所有活动的key和缓存数据相关的信息),这样nginx可以快速判断一个request是否命中或者未命中缓存,1m可以存储8000个key,10m可以存储80000个key。
●inactive:删除指定时间内未被访问的缓存文件,默认10分钟。
●max_size:设置了缓存存储的上限,如果不指定,最大会用掉所有磁盘空间。
●use_temp_path:直接把临时文件放在缓存目录中。
#####################################################

upstream cache_server{
    server 192.168.80.20:80;
    server 192.168.80.30:80;
}

server {
    listen 80;
    server_name www.kgc.com;
    location / {
        proxy_cache my_cache;               #指定用于页面缓存的共享内存,zone名称由proxy_cache_path指令定义
        proxy_cache_valid 200 5m;           #为不同的响应状态码设置不同的缓存时间,此为缓存状态码为200的请求,缓存时长为5分钟
        proxy_cache_key $request_uri;       #指定缓存文件的key为请求的URI
        add_header Nginx-Cache-Status $upstream_cache_status      #把缓存状态设置为头部信息,响应给客户端
        proxy_pass http://cache_server;     #设置代理转发的后端服务器的协议和地址
    }
}
}

#对于一些实时性要求非常高的页面或数据来说,就不应该去设置缓存,下面来看看如何配置不缓存的内容。
proxy_cache_path /data/nginx/cache levels=1:2 keys_zone=my_cache:10m max_size=10g inactive=60m use_temp_path=off;
server {
listen 80;
server_name cache.lion.club;
#URI 中后缀为 .txt 或 .text 的设置变量值为 “no cache”
if ( r e q u e s t u r i   ( ˙ t x t ∣ t e x t ) request_uri ~ \.(txt|text) requesturi (˙txttext)) {
set $cache_name “no cache”
}

location / {
proxy_no_cache $cache_name; #判断该变量是否有值,如果有值则不进行缓存,如果没有值则进行缓存
proxy_cache my_cache; #设置缓存内存
proxy_cache_valid 200 5m; #缓存状态为200的请求,缓存时长为5分钟
proxy_cache_key $request_uri; #缓存文件的key为请求的URI
add_header Nginx-Cache-Status $upstream_cache_status #把缓存状态设置为头部信息,响应给客户端
proxy_pass http://cache_server; #代理转发
}
}

九、CDN

简介

CDN的全称是Content Delivery Network,即内容分发网络。CDN是构建在现有网络基础之上的智能虚拟网络,依靠部署在各地的边缘服务器,通过中心平台的负载均衡、内容分发、调度等功能模块,使用户就近获取所需内容,降低网络拥塞,提高用户访问响应速度和命中率。CDN的关键技术主要有内容存储和分发技术。
简而言之,就是将数据部署在各地的服务器中,通过负载均衡技术,让用户就近获取服务器中的数据。
在这里插入图片描述

原理

CDN的基本原理是广泛采用各种缓存服务器,将这些缓存服务器分布到用户访问相对集中的地区或网络中,在用户访问网站时,利用全局负载技术将用户的访问指向距离最近的工作正常的缓存服务器上,由缓存服务器直接响应用户请求。
在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值