开始做一个文本查重的系统,功能指标包括数据输入,结果输出,查重检测以及系统管理。 文本查重的算法部分应该会使用simhash,工具是python,先留个坑,稍后再填。 20190312 项目凉了,记录已完成工作,开始填坑。