阿里云DDoS高防 - 访问与攻击日志实时分析（二）

最新推荐文章于 2023-10-23 11:00:30 发布

weixin_33978044

最新推荐文章于 2023-10-23 11:00:30 发布

阅读量477

点赞数

文章标签：移动开发操作系统

原文链接：https://yq.aliyun.com/articles/603951

版权

概述

本文介绍了如何配置DDoS日志分析功能，结合实际场景详细介绍了如何使用日志对DDoS访问与攻击日志进行分析与图形化操作。

前提配置

刚进入DDoS高防控制台的全量日志下，在界面引导下开通日志服务并授权操作后。就可以给特定的网站启用日志分析功能了。

分析界面介绍

当选择某一个网站点击日志分析时，会展示基于这个网站的日志分析界面：

这个查询界面大致可以划分为如下几个功能区域：

1. 日志库与项目信息

当为特定DDoS的防护网站打开了日志分析的功能时, DDoS会实时将相关网站的访问和防护日志导入到您拥有的日志服务的专属日志库中。默认打开日志分析的网站的日志都会集中放到这一个日志库中。
专属的日志库名字是ddos-pro-logstore，存放于日志服务的项目ddos-pro-project-阿里云账户ID中。国内项目在杭州区域，国外项目在香港区域。

当选择特定网站时，区域#4查询框会自动填入特定的查询语句，如：

matched_host: aliyun.com

来展示属于这个网站的日志。关于查询语句框的具体信息可以参考后面内容。

2. 日志时间范围选择器

点击这里可以选择要分析的日志的时间范围，可以是相对时间，也可以使整点时间，或者特定时间：

注意：可以查询的最久日志由日志库的周期决定，日志库默认的周期是3天（3天前的日志会自动删除），默认情况下只能查询到过去3*24小时的日志。如果需要查询更长时间的日志，可以参考这里。

对于选择器的每个选项的更详细的介绍，可以参考这里

3. 辅助配置工具栏

这里是查询操作后的一些辅助工具。包括：
另存为快速查询：将当前区域#4查询框的内容保存并赋予名字，以便复用（如何如何需要在日志服务的高级管理界面中操作）。也可以用于配置告警时使用。
另存为告警：这里是配置告警的控制界面，基于某一个已经保存的快速查询进行报警配置，具体请参考这里。

4. 查询语句输入框

这里基于已经配置的时间范围内，对日志进行搜索。如果保留空白或者输入*表示不做任何过滤，查询选择时间范围内的所有日志。

默认选择一个网站的分析日志时，会自动输入当前选择的网站（例如aliyun.com）的查询条件：

matched_host: aliyun.com

这里可以按照语法自由输入，进行全文搜索或者基于字段的搜索，查询框支持换行（Ctrl + Enter）、语法高亮和提示功能等。

4.1 全文搜索

全文搜索，不需要指定特定的字段，直接输入关键字（可以用双引号括起来），多个关键字以空格（或and）分隔即可，

示例1：多关键字查询

这里搜索包含所有www.aliyun.com和error的日志。例如：

www.aliyun.com error

也可以是：

www.aliyun.com and error

示例2：多关键字`或`条件查询

这里搜索所有包含www.aliyun.com并且包含error或者404的日志。例如：

www.aliyun.com and (error or 404)

示例3：前缀查询

这里搜索所有包含www.aliyun.com并且包含failed_开头关键字。例如：

www.aliyun.com and failed_*

注意：查询只支持后缀加*，不支持前缀*，如：*_error。

4.2 字段搜索

基于特定字段的更精准的搜索，并且支持数值类型字段的比较，主要形式是字段：值或者字段 >= 值这种形式，之间用and、or等进行组合。也可以和全文搜索组合使用（也是通过and、or等连接）。

示例1：多字段查询

这里搜索所有www.aliyun.com被CC攻击的日志：

matched_host: www.aliyun.com and cc_blocks: 1

如果要搜索某个客户端1.2.3.4对网站www.aliyun.com的所有错误404的访问日志，可以这样：

real_client_ip: 1.2.3.4 and matched_host: www.aliyun.com and status: 404

注意：这里使用的字段matched_host、cc_blocks、real_client_ip和status等都是DDoS访问与攻击日志的字段，详细的字段列表和信息，可以参考这里

示例2：数值字段查询

这里搜索所有慢请求日志（响应时间超过5秒）：

request_time_msec > 5000

也支持区间查询，查询响应时间大于5秒且小于等于10秒（左开右闭）的日志：

request_time_msec in (5000 10000]

等价于：

request_time_msec > 5000 and request_time_msec <= 10000

示例3：字段存在与否查询

针对特定字段的存在与否进行查询：

查询存在ua_browser字段的日志：ua_browser: *
查询不能存在ua_browser字段的日志：not ua_browser: *

4.3 完整字段

DDoS网站访问日志和攻击日志具体有哪些字段可以进行查询，它们的含义、类型、格式以及可能的值有哪些，可以参考这里

4.4 详细的查询语法

关于完整的查询语法，例如操作符关键字、优先级、如何查询包含引号的字符等，可以参考这里

5. 符合条件的日志分布

这里一目了然的展示了符合查询时间和查询语句的日志的时间分布。以时间为横轴，数量纵轴的柱状图形式展示。下方展示了查询的日志总数。

注意：可以在柱状图上滑动以选择更小范围的时间区域，时间选择器会自动更新为选择的时间范围，并刷新结果。

6. 分页的日志详细信息

这里以分页的形式展示了每一条日志的详细内容，包括时间、内容以及其中的各个字段。可以对列进行排序、对当前页进行下载，也可以点击#6.1 下载与展示列调整中齿轮按钮，选择特定的字段进行展示等。

注意：可以在页面中点击相应字段的值（或者分词），那么会自动在#4 查询语句输入框中自动加入相应的搜索条件。

例如鼠标点击request_method: GET中的值GET，会自动给搜索框加入如下语句：

原来的搜索语句 and request_method:  GET

7. 字段列表

字段列表展示了日志库的所有字段，它们的含义、类型、格式以及可能的值有哪些，可以参考这里。

点击每一个字段旁的眼睛按钮，可以展开对这个字段的各个值的分布。例如点击content_type将会展示来自当前查询下请求内容类型的分布：

可以点击链接approx_distinct，展示这个字段有多少个唯一的值。也可以点击上图的小图标，展示具体的分布信息。

如果选择的是数值型的字段，如status，则提供最大最小等值的快捷统计方式：

注意：以上操作会切换查询界面为统计界面并展示结果，我们会在后面内容介绍。

统计界面介绍

当在查询界面中的#7. 字段列表中点击某一个字段的快捷统计，会将当前查询界面切换为统计界面，同时注意到，#4. 查询语句输入框也会动被修改一个较长的语句。

以查询界面中的#6. 字段列表中选择某一列如content_type点击approx_distinct链接展示的统计为例，如下：

这个统计界面大致可以划分为如下几个功能区域：

可以看到，与查询界面相比，主要的变化部分就是：#4. 查询与统计语句与输入框以及6#. 统计工具栏和#7. 统计图表展示区。

其他部分并没有变化。

查询与统计语句输入框

以查询界面中的#6. 字段列表中选择某一列如content_type点击approx_distinct链接展示的统计为例。查询语句会从原来的查询语句如：

matched_host: "www.aliyun.com"

变成：

matched_host: "www.aliyun.com" | select  count(1) as pv , content_type from log group by content_type order by pv desc limit 10

换行展示为：

matched_host: "www.aliyun.com"  | 
select  count(1) as pv , content_type
    group by content_type
    order by pv desc 
    limit 10

可以看到，这里用一个|进行分割，前面部分是查询，后面部分是统计。这里的逻辑是：先对选择时间范围内的日志进行查询，满足条件的日志再会根据统计语句的进行统计。
其中查询的部分的用法可以参考前面的内容。这里着重介绍统计的部分。

这里统计的语法其实是一个近乎标准的SQL/92语法。以这里的例子为例，其实就是对字段content_type进行分组group by，计算各种值的总数，按照个数排序，并展示前10个。

统计SQL的一些特殊约定

约定1：from log

这里可以看到，并没有SQL标准里面的from 表格名语句，其实可以写上：from log，但一般省略：

matched_host: "www.aliyun.com"  | 
select  count(1) as pv , content_type
    from log     -- 一般这行可以不写
    group by content_type
    order by pv desc 
    limit 10

约定2：limit 100

这里可以看到有一个limit 10，表示获取前10条，如果不写，那么默认其实是返回前100条，也就相当于自动写上了limit 100

日志时间的操作

每一条DDoS日志都有一个字段time表示日志的时间，其格式如2018-05-31T20:11:58+08:00。分别是年-月-日T时:分:秒+时区，这里的时区是UTC+8区，也就是北京时间。
同时，每条日志都有一个内置字段：__time__，也表示这条日志的时间，以便在统计时进行基于时间的计算。其格式为Unix时间戳，本质是一个自从1970-1-1 0:0:0 UTC时间开始的累计过去的秒数。因此实际使用时，经过可选的计算后，还是要经过格式化才可以展示。

示例1：选择并展示时间

这里在特定时间范围内，选择网站www.aliyun.com被CC攻击的最新10条日志，展示其中时间、来源IP以及访问客户端，直接使用字段time：

matched_host: www.aliyun.com and cc_blocks: 1 
|  select time, real_client_ip, http_user_agent
    order by time desc
    limit 10

示例2：计算时间

如果想要知道CC攻击已经过去几天了，可以使用__time__进行计算：

matched_host: www.aliyun.com  and cc_blocks: 1 
|  select time, 
          round((to_unixtime(now()) - __time__)/86400, 1) as "days_passed",             real_client_ip, http_user_agent
      order by time desc
      limit 10

结果如下：

SQL说明：这里用round((to_unixtime(now()) - __time__)/86400, 1)，先用to_unixtime将now()获取的时间转化为Unix时间戳，再与内置时间字段__time__相减，获得已经过去的时间秒数，最后/86400(一天的总秒数)，再用函数round(data, 1)圆整为小数点后1位数的值。就得到了每条攻击日志，距离现在已经过去了几天。

示例3：基于特定时间分组统计

如果想知道特定时间范围内，某个网站每天被CC攻击的趋势如何，使用如下SQL：

matched_host: www.aliyun.com  and cc_blocks: 1 
| select date_trunc('day', __time__) as dt, 
         count(1) as PV 
      group by dt 
      order by dt

得到如下的结果：

然后可以在图标工具栏中选择线图将结果以折线图的形式展示：

SQL说明：这里使用计算的内置时间字段__time__，传给函数date_trunc('day', ..)进行时间按天对齐，将每条日志分组到了其所属的天的分区中进行统计总数（count(1)），并按照分区时间块排序。
函数date_trunc第一个参数提供更多其他单位进行对齐，包括second、miniute、hour、week、month、year等，更多请参考这里

图表说明：这里配置分组的时间为X轴，各个分组内总数的值为Y轴即可。

示例4：基于时间分组统计

如果想知道更灵活的分组下时间规律，例如某个网站每5分钟被CC攻击的趋势如何，就需要进行数学计算，可以使用如下SQL：

matched_host: www.aliyun.com  and cc_blocks: 1 
| select from_unixtime(__time__ - __time__% 300) as dt, 
         count(1) as PV 
      group by dt 
      order by dt 
      limit 1000

得到如下的结果：

然后可以在图标工具栏中选择线图将结果以折线图的形式展示：

SQL说明：这里使用计算的内置时间字段计算__time__ - __time__% 300（同时使用函数from_unixtime做了格式化），将每条日志分组到了一个5分钟（300秒）的分区中进行统计总数（count(1)），并按照分区时间块排序，获得前1000条（相当于选择时间内的前83小时的数据）。

图表说明：这里配置分组的时间为X轴，各个分组内总数的值为Y轴即可。

客户端IP相关的统计

DDoS日志中有反映真实客户端IP的字段real_client_ip，但某些情况下无法拿到用户真实IP时（例如用户通过代理并跳转头中IP有误的情况），可以直接使用直连客户端IP的字段remote_addr来代替。

示例1：攻击者国家分布

这里对某个网站进行CC攻击的来源国家分布：

matched_host: www.aliyun.com  and cc_blocks: 1 
| SELECT ip_to_country(if(real_client_ip='-', remote_addr, real_client_ip)) as country, 
         count(1) as "攻击次数" 
         group by country

得到结果：

在图标工具栏中选择地图，并配置好域后，可以得到一张基于世界地图的分布图：

SQL说明：这里先用函数if(condition, option1, option2)来选择字段real_client_ip或者real_client_ip（当real_client_ip为-时）。然后对结果IP传给函数ip_to_country得到这个IP对应的国家信息。

图表说明：这里选择世界地图，并配置国家对应的统计结果字段为country，反应颜色深度的列是攻击次数即可。

示例2：访问者省份分布

如果期望获得更细腻度的基于省份的分布，可以使用另外一个函数ip_to_province，例如：

matched_host: www.aliyun.com  and cc_blocks: 1 
| SELECT ip_to_province(if(real_client_ip='-', remote_addr, real_client_ip)) as province, 
         count(1) as "攻击次数" 
         group by province

得到结果：

在图标工具栏中选择地图后选中国地图，可以得到：

SQL说明：这里使用了另外一个IP函数ip_to_province来获得一个IP的所属省份。注意：如果是国外的IP，依然会尝试转化为其国家所属省份（州），但在选择中国地图展示时，会无法展示出来。

示例3：攻击者热力分布

如果期望获得一张攻击者的热力图，可以使用另外一个函数ip_to_geo，例如：

matched_host: www.aliyun.com  and cc_blocks: 1 
| SELECT ip_to_geo(if(real_client_ip='-', remote_addr, real_client_ip)) as geo, 
         count(1) as "攻击次数" 
         group by geo
         limit 10000

得到结果：

然后配置地图可以得到：

SQL：这里使用了另外一个IP函数ip_to_geo来获得一个IP的所在经纬度，并获取前1万条。
图表说明：这里选择地图后选高德地图，配置对应属性后，选择显示热力图即可。

图表操作介绍

上面已经介绍如何在SQL统计结果上，选择表格(默认）展示结果；选择线图展示趋势；选择地图展示分布。日志服务还提供更多丰富的图表进行展示，包括如下：

关于每个图表如何具体配置，可以参考这里

日志字段

字段	名称	例子	备注
__topic__	主题		固定为ddos_access_log
body_bytes_sent	请求发送Body的大小（字节）	2
content_type	内容类型	application/x-www-form-urlencoded
host	源网站	api.zhihu.com
http_cookie	请求cookie	k1=v1;k2=v2
http_referer	请求referer	http://xyz.com	没有则为-
http_user_agent	请求User Agent	Dalvik/2.1.0 (Linux; U; Android 7.0; EDI-AL10 Build/HUAWEIEDISON-AL10)
http_x_forwarded_for	通过代理跳转IP	-
https	是否https	true	可能值：true、false
matched_host	匹配的配置的源站（可能是泛域名）	*.zhihu.com	未匹配则为-
real_client_ip	访问客户的真实IP	1.2.3.4	获取不到时为-
isp_line	线路信息	电信	BGP、电信、联通等
remote_addr	请求连接的客户端IP	1.2.3.4
remote_port	请求连接的客户端端口号	23713
request_length	请求长度（字节）	123
request_method	请求的HTTP方法	GET
request_time_msec	请求时间（微秒）	44
request_uri	请求路径	/answers/377971214/banner
server_name	匹配到的host名	api.abc.com	没有匹配到则为default
status	HTTP状态	200
time	时间	2018-05-02T16:03:59+08:00
cc_action	CC防护策略行为	close	可能的值： none、challenge、pass、close、captcha、wait、login、n等
cc_blocks	表示CC防护是否阻止	1	1-阻止，其他表示通过
cc_phase	CC防护策略	server_ip_blacklist	可能的值：seccookie、server_ip_blacklist、static_whitelist、 server_header_blacklist、server_cookie_blacklist、server_args_blacklist、qps_overmax等
ua_browser	浏览器	ie9
ua_browser_family	浏览器系列	internet explorer
ua_browser_type	浏览器类型	web_browser
ua_browser_version	浏览器版本	9.0
ua_device_type	客户端设备类型	computer
ua_os	客户端操作系统	windows_7
ua_os_family		windows
upstream_addr	回源地址列表	1.2.3.4:443	IP:Port，多个地址用逗号分隔
upstream_ip	实际回源地址IP	1.2.3.4
upstream_response_time	回源响应时间（秒）	0.044
upstream_status	回源请求HTTP状态	200
user_id		12345678