kcf算法中cos_window是什么意思_知网/维普查重系统算法介绍(史上最详细)

5a68303cb85b519a848ca1f9f0f4bf87.png

很多同学在降重的过程中经常是面对一大片标红的文字不知所措,无从下手,甚至修改了两三遍了重复率依然还是没有变,更过分的是有的居然不降反升,这就尴尬了。那么这就要求大家对各个查重系统的规则和算法有一定的了解,针对不同的查重软件,它所收录的数据库是不一样的,其算法机制也不同。

一、知网的查重算法(关于13个字符)

目前大多数学校用的都是知网的查重软件来进行定稿,同时知网的数据库更新也是最快的,它的算法也是最新的。首先,它会将上传的论文进行格式分段检测,以句子作为最小单位来进行检测,一个句子里面如果有13个字符重复的时候,该句子就会被标红。13个字符相对于中文来说是6~7个数字。同时在一段文字里面,重复率不能超过5%。再一个就是如果一句完整的话中40%的关键词是相同的,即便它是不连贯也会标黄,如果关键词的重复率达到60%,即便是这些关键词不连贯,整句话也会标红。

举个栗子:

ab43e36a73e27011bfeff30192466905.png

原句:建安文人警醒发觉,人的生命是如此短暂而脆弱。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值