STAMINA，微软和英特尔推出的新型恶意软件检测方法

YZRuin

已于 2024-07-02 17:36:40 修改

阅读量139

点赞数 1

分类专栏：恶意软件检测文章标签：网络安全安全系统安全

于 2024-06-28 15:50:51 首次发布

原文链接：https://www.cyberdefensemagazine.com/stamina-a-new-approach-to-malware-detection-by-microsoft-intel/

版权

恶意软件检测专栏收录该内容

6 篇文章

订阅专栏

白皮书：https://www.intel.com/content/dam/www/public/us/en/ai/documents/stamina-scalable-deep-learning-whitepaper.pdf

微软和英特尔设计了一种新的恶意软件检测方法，称为 STAMINA，该方法涉及深度学习和将恶意软件表示为图像。

静态恶意软件图像网络分析 (STAMINA) 是微软和英特尔提出的一种新型恶意软件检测方法。该研究基于英特尔研究人员之前通过深度迁移学习进行静态恶意软件分类的研究，其成果随后应用于微软提供的真实数据集，以评估其效率。

“我们研究了将深度迁移学习从计算机视觉应用到静态恶意软件分类的实际好处。回想一下，在迁移学习方案中，我们借用了自然图像或物体中的知识，并将其应用于静态恶意软件检测的目标域。深度神经网络的训练时间加快了，同时仍然保持了较高的分类性能。” STAMINA的研究作者写道。“在本文中，英特尔实验室和微软威胁情报团队在真实用户数据集上证明了这种方法的有效性，并表明从计算机视觉迁移学习进行恶意软件分类可以实现非常理想的分类性能。对于这次合作，我们将这种方法称为静态恶意软件图像网络分析 (STAMINA)”

STAMINA 方法由四个步骤组成：预处理（图像转换）、迁移学习、评估和解释。

该方法依赖于一种将恶意软件样本转换为灰度图像的新技术，然后检测过程基于对与恶意软件样本相关的纹理和结构模式的图像扫描。

“该方法的动机是对绘制为灰度图像的应用程序二进制文件进行目视检查：同一系列的恶意软件之间存在纹理和结构相似性，而恶意软件和良性软件之间以及不同恶意软件系列之间存在差异。”报告继续说道。

专家指出，传统的基于签名的恶意软件检测方法存在局限性，由于恶意代码的演变，静态和动态方法可能不准确或不省时。

研究人员解释说，STAMINA 由四个步骤组成：预处理（图像转换）、迁移学习、评估和解释。

预处理包括创建一个像素流，为每个字节分配一个介于 0 到 255 之间的与像素强度相对应的值，将像素流重塑为二维，并调整大小（“调整为 224 或 299，以便在 ImageNet 上训练的图像模型可用于对图像进行微调”）。

然后，该方法利用迁移学习来训练恶意软件分类器，以便对恶意软件样本进行静态分类。在预处理步骤中，系统针对恶意软件和良性图像进行训练。

“在计算机视觉领域，我们已经做到了，对于特定任务，使用在大量图像上预先训练的模型，并针对目标任务进行迁移学习。主要的迁移学习方案包括用作特征提取器和微调网络。”研究人员指出。

为了评估 STAMINA 方法，专家考虑了准确度、假阳性率、精确度、召回率、F1 分数和受试者工作曲线下面积 (ROC)。

研究人员使用了由 220 万个恶意软件二进制哈希值以及 10 列数据信息组成的 Microsoft 数据集。

“特别是，根据恶意软件分析从业人员的反馈，我们还通过 ROC 报告了 0.1%-10% 的误报率。”论文继续说道。

“他们按照 60:20:20 的比例划分训练集、验证集和测试集，并根据首次发现的良性和恶意性进行划分。”

测试结果证实，STAMINA 可以达到 99.07% 的准确率，假阳性率为 2.58%（准确率为 99.09%，召回率为 99.66%）。准确率为 99.09%，召回率为 99.66%。F1 得分为 0.9937。

专家强调，这种方法对于小型应用程序很有效，而对于大型软件则效果较差，因为将“数十亿像素转换成 JPEG 图像”并调整其大小非常困难。

“对于未来的工作，我们希望评估使用二进制中间表示和使用深度学习方法从二进制中提取的信息的混合模型——这些数据集预计会更大，但可能会提供更高的准确性。”研究人员总结道。“我们还将继续探索深度学习模型的平台加速优化，以便我们能够以对最终用户的功率和性能影响最小的方式部署此类检测技术。”

博客等级

码龄7年

14
原创

175
点赞

169
收藏

121
粉丝

关注

私信

热门文章

分类专栏

最新评论

状态空间对偶 (Mamba-2) 第一部分 - 模型
weixin_42112760: SSD在mamba2中还是表示为SSM，是因为只用在X ，B，C生成的原因吗吗？
状态空间对偶 (Mamba-2) 第一部分 - 模型
weixin_42112760: SSD在mamba2中还是表示为SSM，是因为只用在X ，B，C生成的原因吗吗？
状态空间对偶 (Mamba-2) 第一部分 - 模型
CSDN-Ada助手: 推荐 Python入门技能树：https://edu.csdn.net/skill/python?utm_source=AI_act_python
AGDB: A Dictionary-based Malicious Domain Detection Method based on Representation Fusion
CSDN-Ada助手: 恭喜您发布了新的博客文章！标题中提到的“AGDB: A Dictionary-based Malicious Domain Detection Method based on Representation Fusion”听起来非常专业和有趣。我非常期待阅读您的研究成果，并了解更多关于这种基于表示融合的恶意域名检测方法的内容。希望您能继续坚持创作，分享更多有价值的知识和见解。同时，我建议您可以在下一篇博客中深入探讨该方法的实际应用场景和效果评估，以及可能的改进方向。祝您写作顺利，期待您的下一篇精彩作品！
Mobile network quality of experience using big data analytics approach
CSDN-Ada助手: 恭喜您撰写了这篇题为“Mobile network quality of experience using big data analytics approach”的博客！您对移动网络质量的体验进行了深入的研究，运用大数据分析方法进行了探索，这是非常有深度和价值的主题。我非常欣赏您对这一领域的专业知识和研究能力。在下一步的创作中，或许您可以结合实际案例或者调查数据来进一步支持您的观点。这样可以使您的博客更具有说服力，并为读者提供更多实用的信息。同时，您也可以考虑探索其他可能影响移动网络质量的因素，如网络拥塞、信号强度等。这将进一步丰富您的内容，使读者对移动网络质量有更全面的了解。再次感谢您的分享，并期待您在未来继续带来更多有见地的博客文章！如何快速涨粉，请看该博主的分享：https://hope-wisdom.blog.csdn.net/article/details/130544967?utm_source=csdn_ai_ada_blog_reply5

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。