摘要
本周实现了python的基于AST以及Smith_Waterman算法的代码相似度计算
本周总结
1、学习了由张丽萍主编的《基于AST的多种语言代码抄袭检测方法研究》。并且尝试实现了其中的相似度比较部分,但是可能还是会有一点偏差,相似度的比较未必有那么的准确。
2、也发现了自己的问题,上周的AST产生没有想象中的好用,所以就换了一种方法。详细见上述连接
下周期望
1、相似度的结果不是很准确,所以计划更加细颗粒度的比较。
2、然后就是看看有没有产生java以及C的AST的方法,然后套用这个算法即可。