NLP的自动化二进制分析
文章平均质量分 94
飞天王八易
这个作者很懒,什么都没留下…
展开
-
基于NLP的软件分析和程序漏洞挖掘(一)
1.前言由于深度学习模型对数据较高的依赖性,需要大量标注好的数据,数据量少必定会造成模型过拟合和泛化能力差。因此,NLP领域开始关注海量未标注的数据。预训练模型的最初探索主要致力于浅层语义表示和上下文语义表示。最早关注的浅层语义表示是Word2Vec等,为每个单词学习一个固定的单词编码,而后在多个任务上都用相同的编码,这样表示方法必定带来无法表示一词多义的问题,所以NLP开始探索具有上下文语义的单词词嵌入。而现今病毒,网络攻击不再是攻击单一的攻击面,可能对整个系统的所有部件进行修改最后形成攻击者想执行的原创 2021-11-24 11:39:47 · 944 阅读 · 0 评论 -
基于NLP的软件分析和程序漏洞挖掘(二)
找到NLP在软件分析和漏洞挖掘的契合点之后,我们需要去调研这方面现有的研究情况。发现已经有人使用NLP来对二进制代码进行分析,主要有3种方向上使用NLP分析二进制代码,但大多数都是对二进制代码进行静态分析,以下就这三种分析方向进行介绍。Code Similarity Detection至今,已经有两篇文章使用NLP做代码相似性检测,分别是 Safe: Self-attentive function embeddings for binary similarity 发表在2019 Detection of原创 2021-12-01 14:33:27 · 1360 阅读 · 0 评论