1.图像法
参考论文《一种基于多特征集成学习的恶意代码静态检测框架》
将二进制文件按照8b无符号整数依次读取并存入向量中; 其次读取文件大小, 根据文件大小与灰度图宽度映射表得到灰度图的 width , 而后根据文件大小和 width 计算灰度图的height,将 这些向量转为形状是 [height,weight ] 的 2D 数组, 最后将2D 数组可视化[0,255] 范围内的灰度图像。
2.源代码检测
参考论文《基于深度学习的JavaScript恶意代码检测技术研究与实现_杨宇行》
一段恶意代码和非恶意代码可能拥有相同的AST,所以需要对它们的语义进行分析。
通过AST分析语法信息,通过CFG分析语义信息