恶意软件相似度检测过程

最新推荐文章于 2022-11-16 15:22:26 发布

V丶Chao

最新推荐文章于 2022-11-16 15:22:26 发布

阅读量853

点赞数 1

分类专栏：安全研究 - 恶意软件文章标签：算法 python java 人工智能机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u011698800/article/details/107607219

版权

安全研究 - 恶意软件专栏收录该内容

16 篇文章 5 订阅

订阅专栏

https://medium.com/@QuoLab/prioritization-and-propagation-of-malware-sample-analysis-84a3bcd1e6f
这篇文章是这么一个流程，
引出问题：如果对每个二进制进行分析，那么在分析人手比较少的时候，这种会造成资源负担；同时，如果采用先来先分析或者随机选择的方法，这种方式也会造成重复分析的过程。
那么也就是说，我们需要一种手段，能够帮助我们减少人力，最大程度的分析二进制文件。

首先呢，我们分析这个二进制的目的，就是为了能够得到这个二进制文件的内容，而且得到越多的信息越好；但是，完全不用人工分析是不可能的，必然是要靠机器和人工共同协作的过程。
那么这个时候，就出现了这么一个问题，怎么样尽可能减少人工分析的过程，又能帮助我们得到最多的样本，同时进行标注。
将问题分解，整体流程如下：

构建一个相似度图，这个相似度图是以图为基础
利用图聚类的方法，将这些点聚类为不同的组
从每个组中，挑选一些进行分析，然后给这些组添加上标签
利用半监督算法将这些标签在组内传播

关键算法：图聚类算法，选择某种方式挑选代表性的样本，最后利用基于图的半监督算法来完成这个东西

文章已保存为pdf

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
恶意软件相似度检测过程

https://medium.com/@QuoLab/prioritization-and-propagation-of-malware-sample-analysis-84a3bcd1e6f这篇文章是这么一个流程，引出问题：如果对每个二进制进行分析，那么在分析人手比较少的时候，这种会造成资源负担；同时，如果采用先来先分析或者随机选择的方法，这种方式也会造成重复分析的过程。那么也就是说，我们...
复制链接

扫一扫

专栏目录

V丶Chao CSDN认证博客专家 CSDN认证企业博客

码龄11年

515: 原创

1万+: 周排名

6161: 总排名

60万+: 访问

: 等级

6245: 积分

6904: 粉丝

334: 获赞

111: 评论

1150: 收藏

私信

关注

热门文章

分类专栏

最新评论

爱思唯尔latex模板文件使用过程
我要赶紧毕业找到好工作: 将ins文件和dtx文件放到latex环境下。这是什么意思呀
交叉验证--关于最终选取模型的疑问
weixin_66706618: 请问这个问题解决了吗我现在也在纠结这个问题
交叉验证--关于最终选取模型的疑问
记录问题的菜鸡: 我想问一个问题，就是进行特征工程的时候是使用所有的数据吗，然后得到最佳子集后，利用贝叶斯的10重交叉验证对整个数据集优化得到的平均精度就是我们的测试精度，然后使用贝叶斯得到的最佳超参数重新训练整个数据集，得到最终的模型，因为所有数据都用了，所以此时最终模型的性能无法量化，直接进行实际应用？是这样的吗？
关于深度学习的滞后性问题
lygaily: 不过我也觉得如果特征足够多，数据足够多，滞后性会减轻，但彻底没有是不可能的
关于深度学习的滞后性问题
lygaily: 我觉得还是做分类更有意义。做回归预测解释性不好，对方向的预测也总会滞后，我很认可你说的说法。

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。