找数据集发现了安卓恶意软件检测这个方向
就找到了 看了下也不是很新 但是近几年发文章的人挺多 就这个了 反正也找不到我写啥
这是几个安卓恶意软件数据集
入手
先看几篇中文论文 别人怎么做的
前两章讲恶意软件问题啥的先不管;
第三章写恶意软件数据集 一类是恶意样本共享网站 二类是具有家族信息的常用数据集 这些数据集干嘛的有点不懂 分类太多了 跟我论文相关的数据集应该是包含特征值和标签的数据集 这样适合随机森林机器学习。
第四章 基于特征码的恶意软件检测 基于特征码的恶意软件检测方法基本原理是利用每个软件特有的特征信息进行匹配, 即在已知恶意软件指定特征码的情况下, 通过与目标待检测软件的特征码进行匹配, 如果在已有的恶意软件特征码数据库中找到相同的特征码则将目标软件判定为恶意软件, 否则为良性软件.
第五章 基于机器学习的恶意软件检测 基于机器学习的恶意软件检测方法的基本原理是通过程序分析等技术提取不同的特征描述待分析样本的不同行为, 然后每一个样本均用一个固定维度向量表示, 最后借助于现有的机器学习算法对已知标签的样本进行训练并构建分类器, 从而能够对未知样本进行预测判断
特征选择的方法 1是使用app使用的权限 2是它使用的api接口作为接口;除了经典的权限以及 API 特征之外, 许多研究工作 [15,71∼75] 发现 Android 的相关 Intent、字符串以及组件也可以作为恶意软件的有效特征 都可以作为特征
另一个方向 数据指的是与 app 应用程序本身代码无关的额外描述信息, 例如该 app 的下载量、功能描述、类别信息等. 该类信息可以从另外一个新的角度对现有的特征进行完善, 从而提升检测效果.
第六章 基于行为的检测方法 下一篇
怎么感觉这个文章很水。。。
好像是用权限作为特征 训练样本 500左右 太少了
Android malware detection based on image-based features and machine learning techniques 基于图像特征和机器学习技术的安卓恶意软件检测
本文提出了一种基于恶意代码分类的安卓系统恶意代码检测模型。该模型基于将 Android 应用程序源文件转换为灰度图像。从已构建的灰度图像数据集中提取了一些基于图像的局部特征和全局特征,包括4种不同类型的局部特征和3种不同类型的全局特征,并用于训练模型。据我们所知,这种类型的特性首次用于 Android 恶意软件检测领域。此外