基于机器学习和API调用序列的恶意软件检测方法

最新推荐文章于 2023-09-06 09:45:18 发布

yuan_mes

最新推荐文章于 2023-09-06 09:45:18 发布

阅读量2.9k

点赞数

分类专栏：大数据安全分析文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/m0_46281300/article/details/107400181

版权

本文介绍了基于机器学习的恶意软件检测系统，通过特征提取（如API调用序列的4-gram模型）和分类算法（如朴素贝叶斯、支持向量机等）来识别恶意软件。特征提取中，使用API监听工具获取调用序列，并通过支持度和置信度或发生比率来量化特征。该方法提高了恶意软件检测的准确性。

摘要由CSDN通过智能技术生成

恶意软件定义

恶意软件通常指未经用户授权进入系统，通过扫描系统漏洞并执行破坏性活动，从而使当前系统功能受到一定影响、安全性受到威胁的恶意性软件或程序。恶意软件既可以单独存在，又可以与其它软件整合并存，具有很强的隐蔽性；同时在网络环境中大量存在，容易被攻击者利用。

检测系统架构

基于恶意软件发起的定向网络攻击日益增长，构建起有效的恶意软件监测系统势在必行。一个恶意软件检测系统的核心功能模块包括样本特征提取和分类标记两个部分。

特征提取

对恶意软件样本的特征提取，首先要获取样本程序中实时的API调用序列，这一步可以通过借助所在系统的API监听工具实现。其次，针对API调用序列的处理，目前通常采用n元语法模型(n-gram)。n-gram 模型的思想是，首先确定特征序列的长度为n，在假定第n个出现的词只与在它之前出现的n−1个词相关，那么在一个长度远大于n的词组序列中，就通过滑动窗口的形式来将整体序列划分为多个特征序列。经过已有实验验证，4-gram在实际应用中的效果相对较好。
最后，对于每个单独的特征序列的处理，不同的文章采用特征度量方式也有所不同。Ravi等人[1]首先针对已有的样本数据，通过上述的序列处理之后，计算其支持度和置信度，然后根据初始类别标签形成一条关联规则。支持度S与置信度C的计算方式如下：
$S=\frac{I_A}{N}\times100\%$

最低0.47元/天解锁文章

yuan_mes

关注

0
点赞
踩
11

收藏

觉得还不错? 一键收藏
1
评论
基于机器学习和API调用序列的恶意软件检测方法

文章目录恶意软件定义检测系统架构特征提取分类算法参考文献恶意软件定义恶意软件通常指未经用户授权进入系统，通过扫描系统漏洞并执行破坏性活动，从而使当前系统功能受到一定影响、安全性受到威胁的恶意性软件或程序。恶意软件既可以单独存在，又可以与其它软件整合并存，具有很强的隐蔽性；同时在网络环境中大量存在，容易被攻击者利用。检测系统架构基于恶意软件发起的定向网络攻击日益增长，构建起有效的恶意软件监测系统势在必行。一个恶意软件检测系统的核心功能模块包括样本特征提取和分类标记两个部分。特征提取对恶意软件样本的
复制链接

扫一扫

专栏目录