使用 XINCheck SDK 开发查重系统

XINCheck SDK是一个提供了文本查重引擎和文本查重算法的java包,使用它可以快速开发涉及文本查重相关的功能。比如标书查重、论文查重、文档查重、作业查重之类的。也有基于这个sdk开发的桌面端软件,我这边也进行了试用。可以看这个链接 XINCheck 桌面端使用介绍。好了废话不多说,下面简单介绍一下SDK的使用方式

一、引入查重SDK

通过maven将本SDK 0.5.0版本引入到项目中

XINCheck SDK需要使用1.8.0_151及以上版本的JDK,如JDK低于此版本,需要修改JDK加密策略文件或升级JDK。

SDK存放在私有maven仓库中,需要先在中添加以下仓库

<repository>
    <id>XINCHECK</id>
    <name>XINCHECK Public Repository</name>
    <url>https://maven.xincheck.com/repository/maven-releases/</url>
</repository>

然后在中添加依赖

<dependency>
    <groupId>com.xincheck</groupId>
    <artifactId>duplicate-check</artifactId>
    <version>0.5.3</version>
</dependency>

除maven外同样支持Gradle、lvy等,修改对应引入语法即可。

二、授权SDK

非商业用户可以申请免费的许可证,需要先调用下面的方法获取并打印服务器或PC机的机器指纹

System.out.println(CheckManager.INSTANCE.getMachineCode());

访问获取免费版授权页面获取授权许可证,然后再拿获取到的免费授权对SDK进行授权

	CheckManager.INSTANCE.setRegCode("授权许可证");

三、使用简易启动器开始查重

SDK内置了简易启动器EasyStarter,一行代码即可完成SDK调用。参数介绍如下

  • 参数1:待查文件所在的文件夹路径(如果待查文件只有一个,可以传文件路径);
  • 参数2:比对库文件所在的文件夹路径(如果比对库中只有一个文件,可以传文件路径);
  • 参数3:保存查重报告的文件夹路径。如果不需要导出查重报告可以传空字符串;
  • 参数4:白名单文本。对于标书查重等场景,有一些文本是允许重复的,这些文本可以通过该
    参数传入。该参数可选,如不需要可以不传或传null。
	List<Reporter> reporters = EasyStarter.check(new File("参数1"), new File("参数2"), "参数3", "参数4");
横向查重应用场景下参数1和参数2可以相同,相同的文件会自动跳过比对,不会出现重复率100%的问题。除示例方法外,该方法还有多个重载,具体可以自行了解,如需详细了解。 完整示例代码可参见 [GitHub](https://github.com/tianlian0/duplicate-check-sample "GitHub") 链接中的 EasyStart 部分。

四、查重结果

查重完毕后可以保存如下样式的html查重报告,部分样式可以通过接口自定义:

五、详细开发文档

EasyStarter只适用于逻辑简单、数据量少、无异步执行需求的应用场景,其中大量参数使用了默认值。实际项目开发过程中,对于复杂的应用场景,可以查阅完整的开发者接入文档,使用原生方式进行调用:开发者接入文档

六、付费?

XINCheck有付费版本可以购买,具体价格参加它的网站上的报价表。不过个人使用的话其实使用免费版就足够了,虽然免费版只支持8000字以下下的文本查重,但是超过8000字的可以拆分成多个文件进行查重也是一样的。报价表链接


版权声明:本文为CSDN博主「csdn_mark_liu」的原创文章,遵循CC 4.0 BY-SA版权协议。 原文链接:https://blog.csdn.net/liuhuaqiuaaa/article/details/115236682
  • 1
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值