会议名称:CCS '23: ACM SIGSAC Conference on Computer and Communications Security
DOI:10.1145/3576915.3623123
ISBN:9798400700507
阅读原因
1.方班需要 2.里面的内容感兴趣
核心内容
开发了 RETSINA,一个基于元学习的用于跨多个域的零日 Web 攻击检测的新框架。RETSINA 利用从各种域生成的异质请求之间的相关性来构建一 个通用检测模型。基于通用检测模型和每个域的有限请求,RETSINA 生成一个单 独的特定域检测模型来检测该域的攻击,从而实现该域的高效模型训练和更新。
三模块:
自适应预处理:将每个非结构化请求转换为结构化的令牌序列,以便进行语义分析。解析然后根据策略合并不重要的信息
多域表示:把来自异构域的令牌投影到同一特征空间中,在该空间中具 有相似语义的令牌彼此接近。它选择一个域作为基础域,其他域中的令牌根据其 语义相似性表示为基础域中令牌的加权和。
跨域训练:首先 使用辅助域的数据构建一个通用初始模型,然后使用目标域的有限数据将模型适 应到目标域。特别是,通用初始模型通过利用元学习的理念进行训练,以便能够 很好地适应新域。
优势
元学习,构建一个适配此领域的比较普适的模型,使得收敛更块,且效果好。
不足
依据提问老师,文章的结果对比图比较“不公平”,因为同样都是获取相同时间长度的数据,其他模型需要完全从0开始构建,而文章训练的模型则是站在直接预训练的高度上进行精进的,何不让所有模型从0收集数据开始比较?(这个问题我没有考虑到,当时感觉很问题提出的很尖锐)
收获
批判性思维看待事物,尝试从不同角度切入,可能会有不一样的风景。