ROST反剽窃论文检测系统介绍

简介:

ROST反剽窃论文检测系统是通过比对源文档和目标文档相似性给出相似度结果的一种信息处理系统。由武汉大学信息管理学院出版科学系教师沈阳副教授研发的ROST文档相似性检测工具可检测论文的抄袭相似情况,目前已投入约多家单位免费测试,反应良好,一定程度杜绝了有抄袭可能的论文发表问世。该系统现已免费提供给大家使用,下面是武大武大沈博士的百度博客地址:http://hi.baidu.com/whusoft/home

 

ROST反剽窃论文检测系统基本原理:

 

     反剽窃软件自动将文档切割为多个50到200字(可自定义)的小文本,通过混合引擎将其与188亿个网页和490万篇文献进行模糊匹配,标示出每个文本块与文献库中的某些文献的最大相似度。由此软件统计出相似度≥95%(基本原封不动抄袭)与相似度≥80%(略作修改后抄袭)的字数所占总字数比例。我们把这个比例作为剽窃(相似)程度衡量指标。

 

 

ROST反剽窃论文检测系统优点:


覆盖面广,通过混合引擎覆盖约188亿个网页和490万篇论文。系统采用自研的ROST WebSpider和ROST SEAT(元搜索引擎分析和轮询Meta Search Engine Analysis tools for Google 、Baidu、Youdao、Sogou)算法实现了对互联网和部分期刊网的广度覆盖。

 

模糊检测,柔性匹配,为防止抄袭者替换部分字符,删除部分标点符号,系统通过相似度来进行判定。系统采用ROST Similar算法实现相似性检测和度量。系统采用QingQing算法提取信息指纹,在P3、512MBPC上,分词速度为13MB/S,已在互联网提供评测版供业内评测。

 

本软件检测结果只能作为一个参考,可以使用表格右键导出详细检查结果发送给被检查本人,本软件不对是否剽窃做结论,只是告诉你与现存文献相似度高于80%的文字比例所占文章总数比例是多少。高于80%相似度的文字才是需要关注的。

 

规范引文及参考文献去除,降低误判可能性。

 

自定义分块检测机制,将文章的每一文本块与其他文档的相似度都精确的表示出来了,每一文本块约为50字至200字不等(可自定义),以红色表示极度相似(相似度大于80%),一目了然,清晰醒目。当设为50个字一块时,可以在较低信息粒度上查找出可能抄袭或相似的文献。

 

 相似文档模块跟踪技术,可以通过简单操作直接定位相似文档中哪些内容被抄袭或者拷贝,直观明了。

 

结果分析功能,自动分析文档相似结果,给出评价意见。

 

 多种文件格式支持,包括PDF、DOC、PPT、XLS、TXT等文档。

 

专有数据文件保存,不用反复检测,浪费时间。

 


缺点


本反剽窃系统不能覆盖世界上所有中英文文献,关于覆盖率与查全率的相关性问题,正在研究中。

 

检测时间略长,一篇8000字的文档至少耗费约5分钟,需要一点点耐心。

 

本软件检测结果存在一个小的误差,用更小的文档块进行检测,可以减少误差,但需要的时间会相应增加,经过我们在多家编辑部的试用情况,块数大小定为200字较为合适,此时误差率也是可以接受的,文档相似率一般是比实际的要低。

 

在试用版中为了最大限度的检测出各类不同学科的最相关文档,本软件在某些情况下存在误判可能性,此时,用户可以通过调整设置中的两个参数来获得不同的相似指数结果。如果研究性使用,请联系我们调整参数,将系统调整为较严格匹配,后面我们针对这一点会进行软件升级,并发行不同学科的版本。

 

下载地址:http://hi.baidu.com/rostcm/blog/item/6dea9f0d7a13068fd0581bf6.html

本文转自[多戈论文检测网]:http://www.duoge007.com/a/mianfeilunwenjiance/19.html

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值