二进制代码相似度比较研究技术汇总

最新推荐文章于 2024-03-10 18:36:37 发布

清欢科技

最新推荐文章于 2024-03-10 18:36:37 发布

阅读量360

点赞数

文章标签： sqlite

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/HLWQHKJ/article/details/127288919

版权

本文探讨了二进制代码相似度比较技术在安全分析中的应用，如恶意代码追踪、漏洞检测和补丁检测。技术基于源代码属性在二进制中依然存在，尽管编译差异大。文章介绍了多种比较方法，包括语法、语义和结构相似性，以及特征向量和Hash匹配。此外，还讨论了跨架构比较、归一化和应用领域。

摘要由CSDN通过智能技术生成

在对二进制应用程序进行安全分析过程中，二进制代码相似度比较技术是重要的技术手段之一，基于此技术，可以实现对恶意代码极其变种的追踪，已知漏洞检测、补丁存在性检测。该技术基础理论依据是如果源代码中存在的属性(恶意代码、已知漏洞、漏洞修复补丁)即使相同源代码编译出不同的二进制代码(cpu架构、OS、编译选项等会直接导致编译出来的二进制会存在较大的差别)，这些属性在二进制代码中也是存在的(好像是废话，不然编译构建工具就有问题了)。因此若在一个样本二进制文件中已知存在上述类型的属性，如果发现另外一个待检测二进制代码和样本二进制代码相似，那么可以认为待检测二进制代码也存在相同类型的属性。

我们知道编译生成二进制代码的影响因素非常的多，同一套源代码基于不同因素的组合可以生成非常多不同二进制程序。
CPU架构：X86、ARM、MIPS、PPC、RISC-V；
架构位数：32bits、64bits；
OS：Linux、Windows、Android、鸿蒙、VxWork；
编译选项：O0~O3；
安全编译选项：BIND_NOW、NX、PIC、PIE、RELRO、SP、FS、Ftrapv等；
按这些选项可以有5x2x5x4x8 =1600个组合，从中可以看出二进制代码相似度比较技术不管是学术界还是工业界来说都是一个挑战技术。但是基于广阔的应用前景，20多年来学术界一直在不停的探索和研究新的方法想来解决这个技术挑战，并且也取得了一定的成果，下面就该方面的技术进行一些梳理，让大家对二进制代码相似度比较技术有一个大致的了解。

源代码到二进制代

最低0.47元/天解锁文章

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。