- 博客(3)
- 资源 (2)
- 收藏
- 关注
转载 [Algorithm] 使用SimHash进行海量文本去重
阅读目录1. SimHash与传统hash函数的区别 2. SimHash算法思想 3. SimHash流程实现 4. SimHash签名距离计算 5. SimHash存储和索引 6. SimHash存储和索引 7. 参考内容 在之前的两篇博文分别介绍了常用的hash方法([Data Structure & Algorithm] Hash那点事儿)以及局部敏感hash算法([Algorithm]
2017-05-17 14:19:31 327
转载 ICTCLAS_api使用方法
1.首先解压缩ICTCLAS_api_part1.rar和ICTCLAS_api_part2.rar 2.把ICTCLAS_api_part1.rar解压出的文件放到java工程的根目录下(如下图所示) 3.然后把ICTCLAS_api_part2.rar解压出的文件放到src文件夹下(如下图所示) 4.接下来就能在程序中调用ICTCLAS的API了,下面说明最常用的的分词返回分
2016-12-09 15:09:17 355
原创 1. Two Sum
Given nums = [2, 7, 11, 15], target = 9, Because nums[0] + nums[1] = 2 + 7 = 9, return [0, 1]. 我的代码: public int[] twoSum(int[] nums, int target) { int[] sum=new int[2]; int i=nums.l
2016-10-10 21:06:38 216
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人