vulsniper

最新推荐文章于 2023-08-14 17:42:44 发布

匡小萌

最新推荐文章于 2023-08-14 17:42:44 发布

阅读量575

点赞数

分类专栏：文章笔记

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/khy123khy/article/details/107353118

版权

文章笔记专栏收录该内容

11 篇文章 0 订阅

订阅专栏

VulSniper: Focus Your Attention to Shoot Fine Grained Vulnerabilities

IJCAI19

提出了一种新的程序建模方法

提出了一种新的网络结构

建模方法：

生成代码属性图（CPG）。

用 Joern 生成代码代码属性图（CPG），然后存在Neo4j数据库中。

作者将生成的CPG简化了，只保留了CFG和AST。
将简化后的代码属性图（CPG）转化成特征张量。

特征张量T（G）的shape是（n,n,m）。G表示的是代码性质图，包括有n个节点{v₁,v₂,…,v_n}。任意t_i,j,k属于T(G)都需满足以下条件：

f(k)表示的是第k个相关特征，relations(v_i,v_j)表示的是节点v_i，v_j之间的关系特征。当relations(v_i,v_j)与f(k)之间的关系满足某条件时那么就返回 true。

m值的大小是根据不同的编程语言来确定的，这里的m值是144（这个144指的与C/C++相对应的特征个数）。

将程序进行语义分割？？？

即每个程序语句是什么具体语义。（首先要对程序语句的语义进行规范，总结。一共有哪几种语义）

搞清楚一个问题，漏洞是程序语句中的实际某个token（这个token可以表示某个变量，函数等）对这些的影响。

即漏洞归根到底是不合适的操作导致的还是不合适的数据导致的，还是两者的结合。

数据集的规范问题？？？

不同的paper中都有自己的数据集。比如对于都是从SARD中提取出来的函数源码，如果只是二分类问题即程序是否有漏洞，那么这个这个label应该也是一致的。这种情况下，如果因为不同的建模需要，对源码进行的预处理，这个我认为不算作在数据集规范里。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。