一、提要
当前各模块负责人(点击人名可跳转至CSDN个人主页):
代码与文本查重—王帅
界面设计、数据库设计——牛翔宇
代码检测——吴玮桓
代码与文本查重——李成
本文简单记录2021.4.25——2021.5.1一周内各成员工作内容总结和对下一周工作内容的展望。具体内容请查看个人总结文章:
2021.5.1项目阶段报告-王帅
2021.5.1项目阶段报告-吴玮桓
2021.5.1项目阶段总结-李成
2021.5.2项目阶段总结-牛翔宇
二、本周总结
1.代码与文本查重(王帅)
1.能够处理pdf文档;
2.能够解压zip、rar形式的压缩文件;
3.补充了一些需要用到的方法;
4.docx文档中的元素部分按序识别;
5.尝试混淆工具修改指定内容。
2.代码检测(吴玮桓)
1.已经实现了通过python遍历文件夹中的所有.py并进行动态编译
2.尝试通过实现创建web接口实现网页中查看编译结果
3.代码与文本查重(李成)
1、对与上述的结构查重,找到了一种方法,是由张丽萍主编的《基于AST的多种语言代码抄袭检测方法研究》。主要分成了三个部分,第一步是代码的形式化过程,将代码转化为AST序列,第二部是计算相似度,运用序列匹配算法对比生成的AST序列。第三步是聚类分析,运用前两部保存的信息进行聚类分析,找到抄袭。
2、她在文章中讲到所用到的工具ANTLR,使用它来进行代码的形式化
4.界面设计、数据库设计(牛翔宇)
本周完成了使用python的pymysql模块对阿里云数据库PolarDB的MySQL数据库进行连接、查询、插入等操作。并通过此功能实现了简单的用户登录和注册功能界面。
三、下周计划
1.代码与文本查重(王帅)
网络查重
2.代码检测(吴玮桓)
实现动态编译C++项目
3.代码与文本查重(李成)
1、先做出来代码的AST分析功能,使其更加完善,如果比较简单,那么就考虑做那个对比的第二部
2、找一找有没有其他的接口
3、看看网络查重方面的资料
4.界面设计、数据库(牛翔宇)
每个功能增加一个进度条,真正的利用多线程
寻找更好的检测sonarqube服务器是否完全打开的方法
将查重检测结果录入到PolarDB的功能集成起来
以上为未来初步规划,未必能保证一周内全部完成。