[论文阅读]Learning from Limited Heterogeneous Training Data: Meta-Learning for Unsupervised Zero-Day Web

会议名称:CCS '23: ACM SIGSAC Conference on Computer and Communications Security

DOI:10.1145/3576915.3623123

ISBN:9798400700507

发布链接:Learning from Limited Heterogeneous Training Data: Meta-Learning for Unsupervised Zero-Day Web Attack Detection across Web Domains | Proceedings of the 2023 ACM SIGSAC Conference on Computer and Communications Security

阅读原因

1.方班需要 2.里面的内容感兴趣

核心内容

开发了 RETSINA,一个基于元学习的用于跨多个域的零日 Web 攻击检测的新框架。RETSINA 利用从各种域生成的异质请求之间的相关性来构建一 个通用检测模型。基于通用检测模型和每个域的有限请求,RETSINA 生成一个单 独的特定域检测模型来检测该域的攻击,从而实现该域的高效模型训练和更新。

三模块:

自适应预处理:将每个非结构化请求转换为结构化的令牌序列,以便进行语义分析。解析然后根据策略合并不重要的信息

多域表示:把来自异构域的令牌投影到同一特征空间中,在该空间中具 有相似语义的令牌彼此接近。它选择一个域作为基础域,其他域中的令牌根据其 语义相似性表示为基础域中令牌的加权和。

跨域训练:首先 使用辅助域的数据构建一个通用初始模型,然后使用目标域的有限数据将模型适 应到目标域。特别是,通用初始模型通过利用元学习的理念进行训练,以便能够 很好地适应新域。

优势

元学习,构建一个适配此领域的比较普适的模型,使得收敛更块,且效果好。

不足

依据提问老师,文章的结果对比图比较“不公平”,因为同样都是获取相同时间长度的数据,其他模型需要完全从0开始构建,而文章训练的模型则是站在直接预训练的高度上进行精进的,何不让所有模型从0收集数据开始比较?(这个问题我没有考虑到,当时感觉很问题提出的很尖锐)

收获

批判性思维看待事物,尝试从不同角度切入,可能会有不一样的风景。

评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值