第一次个人编程作业

第一次个人编程作业
摘要由CSDN通过智能技术生成

第一次个人编程作业

软件工程第一次作业 班级链接
作业要求 作业链接
作业目标 设计一个论文查重算法,给出一个原文文件和一个在这份原文上经过了增删改的抄袭版论文的文件,在答案文件中输出其重复率
其他参考文献 Java—SimHash原理与实现
simhash算法及原理简介

1.github仓库地址

2.PSP表格

PSP Personal Software Process Stages 预估耗费()分钟 实际耗时(分钟)
Planning 计划 180 150
· Estimate 估计这个任务需要多少时间 240 300
Development 开发 480 720
· Analysis 需求分析(包括学习新技术) 120 120
· Design Spec 生成设计文档 60 60
· Design Review 设计复审 30 30
· Coding Standard 代码规范(为目前的开发制定合适的规范) 30 30
· Design 具体设计 60 60
· Coding 具体编码 240 300
· Code Review 代码复审 60 60
· Test 测试(自我测试。修改代码,提交修改) 120 120
Reporting 报告 60 30
· Test Repor · 测试报告 60 30
Size Measurement · 计算工作量 5 5
· Postmortem & Process Improvement Plant · · 事后总结, 并提出过程改进计划 10 10
· 合计 1865 1985

3.计算模块接口的设计与实现过程

3.1设计思路

3.2simhash算法原理

请添加图片描述

3.3关键代码实现

hanlp类实现
public class hanlp {
   
    public ArrayList<String>   separate(String txt){
   
        File file = new File("D:\\idea_project\\text\\text_ext\\cn_stopwords.txt");//使用IO输入停用词文件
        ArrayList<String> stopword = new ArrayList();
        
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值