vulsniper

VulSniper: Focus Your Attention to Shoot Fine Grained Vulnerabilities

IJCAI19

提出了一种新的程序建模方法

提出了一种新的网络结构

建模方法:

  1. 生成代码属性图(CPG)。

    用 Joern 生成代码代码属性图(CPG),然后存在Neo4j数据库中。

    作者将生成的CPG简化了,只保留了CFG和AST。

  2. 将简化后的代码属性图(CPG)转化成特征张量。

    特征张量T(G)的shape是(n,n,m)。G表示的是代码性质图,包括有n个节点{v1,v2,…,vn}。任意ti,j,k属于T(G)都需满足以下条件:

    f(k)表示的是第k个相关特征,relations(vi,vj)表示的是节点vi,vj之间的关系特征。当relations(vi,vj)与f(k)之间的关系满足某条件时那么就返回 true。

    m值的大小是根据不同的编程语言来确定的,这里的m值是144(这个144指的与C/C++相对应的特征个数)。


将程序进行语义分割???

即每个程序语句是什么具体语义。(首先要对程序语句的语义进行规范,总结。一共有哪几种语义)

搞清楚一个问题,漏洞是程序语句中的实际某个token(这个token可以表示某个变量,函数等)对这些的影响。

即漏洞归根到底是不合适的操作导致的 还是不合适的数据导致的,还是两者的结合。


数据集的规范问题???

不同的paper中都有自己的数据集。比如对于都是从SARD中提取出来的函数源码,如果只是二分类问题即程序是否有漏洞,那么这个这个label应该也是一致的。这种情况下,如果因为不同的建模需要,对源码进行的预处理,这个我认为不算作在数据集规范里。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值