Understand
文章平均质量分 79
蛐蛐蛐
个人主页:https://quyu.github.io/
展开
-
记录一个srcML和javalang等工具做tokenization不一致的地方
这个问题比较细,估计只有做源码分析的盆友会有点兴趣。我在平时会用srcML,javalang,Understand做tokenization,有时也会一起使用,但是发现这些工具有不一致的地方,所以简单以一个例子记录一下: 例如下面这段Java代码: class Test{ public WndJournal(){ int width = SPDSettings.landscape() ? WIDTH_L : WIDTH_P; int height = SPDSettings.lands原创 2021-05-16 07:32:12 · 221 阅读 · 1 评论 -
如何使用Understand Perl API对BigCloneBench中的Java Method的起始、终止行进行提取
这个标题好长……,接上篇博客的内容,上篇博客中讲到,IJaDataset里面的源代码都是Java文件,但是数据库中的记录都是Method级别的,这时候就需要根据Java源文件提取出每个Method,并且确定每个Method的“STARTLINE”和“ENDLINE”,本来觉得用Understand应该很好实现,谁知道也试了好几种方法。 最简单的想法,看看每个Method的entity(Perl API中的ent)是否有这个属性,可惜没有。又仔细看了看API,看到这里: http://documentat原创 2021-01-14 14:44:38 · 600 阅读 · 0 评论