crawl结果文件夹中的index,indexes文件夹的区别

最新推荐文章于 2022-01-25 10:48:08 发布

Kaiwii

最新推荐文章于 2022-01-25 10:48:08 发布

阅读量759

点赞数

分类专栏：开源搜索引擎（nutch）文章标签： path

开源搜索引擎（nutch）专栏收录该内容

15 篇文章 0 订阅

订阅专栏

1、nutch-1.x中在crawl.java中。最后有这么一句话。

?indexer.index(indexes, crawlDb, linkDb, Arrays.asList(HadoopFSUtil.getPaths(fstats)));

它会把crawldb，linkdb以及segments，进行建立索引。生成文件 indexes,里面包含了part-00000,.....根据自己的depth而定。

2、

dedup.dedup(new Path[] { indexes });
fstats = fs.listStatus(indexes, HadoopFSUtil.getPassDirectoriesFilter(fs));
merger.merge(HadoopFSUtil.getPaths(fstats), index, tmpDir);

主要是对刚才生成的indexes索引部分进行合并（MD5）。删除重复的索引。根据自己的业务可以适量的修改。

2、分布式索引在指定时也可以指定 indexes部分，也可以指定index部分，两者的区别应该知道了吧！

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
crawl结果文件夹中的index,indexes文件夹的区别

1、nutch-1.x中在crawl.java中。最后有这么一句话。?indexer.index(indexes, crawlDb, linkDb, Arrays.asList(HadoopFSUtil.getPaths(fstats)));它会把crawld
复制链接

扫一扫

专栏目录

Kaiwii CSDN认证博客专家 CSDN认证企业博客

码龄16年

94: 原创

12万+: 周排名

204万+: 总排名

199万+: 访问

: 等级

1万+: 积分

616: 粉丝

437: 获赞

186: 评论

484: 收藏

私信

关注

热门文章

分类专栏

最新评论

补码综合理解
做而论道_CS: －－－－－－－－－－－－－－　求补码，是极其简单的事！－－－－－－－－－－－－－－真值机器数符号位原码反码取反加一符号位不变模同余 ... 这些，都是毫无用处的。即使，你把专家编造的这些谎话，都背下来了，你也不会理解：“减法怎么就变成加法啦？”。专家写的这些，明显就是【拿个鞋拔子当做玉如意】。假货，不仅仅在古董行业才有啊！
补码综合理解
做而论道_CS: －－【划重点】－－－－－－－－－－实际上，任意负数（－X）的补码，都是：0 － X。你用二进制简单算一下，立刻就能得到结果。（－128 的 8 位补码，也就是这样求出来的。）同理，任意正数（＋X）的补码，也都是：0 ＋ X。 0 ＋ X，不就是 X 吗？即，正数的补码，就是 X 本身！－－－－－－－－－－－－－－－－－
补码综合理解
做而论道_CS: 学习计算机，千万不要学习原码和反码呀！原码反码，都是虚构的。实际上，它们，都是不存在的。学习计算机，首先，要认识到两个概念： 1. 计算机每次计算，位数，是固定的。　八位机，每次，就计算机八个位。 2. 计算机中，只有加法器。　减法（或负数），都必须用加法实现。那么，45－45 = 0，计算机怎么算呢？八位机将如下计算：　　0010 1101 + xxxx xxxx = 0000 0000。其中的：xxxx xxxx，就是【－45 的八位补码】。这个补码，到底是什么？你自己也能推导出来。先移项：xxxx xxxx = 0000 0000－0010 1101，可得出：xxxx xxxx = (借位 1) 1101 0011，取八位：xxxx xxxx = 1101 0011。至此，就求出了 [－45]补 = 1101 0011。求负数的补码，就是这么简单！
补码综合理解
做而论道_CS: 在计算机系统中，数值，一律采用补码表示和存储。数值和补码，直接转换就行了。根本就用不着原码和反码。
补码综合理解
做而论道_CS: 码长八位时，各码的范围如下。原码：－127 ~ +127。反码：－127 ~ +127。补码：－128 ~ +127。注意：－128，没有原码反码，只有补码。补码，是怎么求出来的？没有原码，拿什么取反？没有反码，拿什么加一？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。