如何查看Nutch命令

最新推荐文章于 2021-04-15 17:58:13 发布

Kaiwii

最新推荐文章于 2021-04-15 17:58:13 发布

阅读量819

点赞数

分类专栏：开源搜索引擎（nutch）文章标签： csv statistics application command url class

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Kaiwii/article/details/6691709

版权

开源搜索引擎（nutch）专栏收录该内容

15 篇文章 0 订阅

订阅专栏

比如要找readdb的使用方法

可以用文本方式打开bin/nutch.sh

然后，找到相应的这么一句：

elif [ "$COMMAND" = "readdb" ] ; then
CLASS=org.apache.nutch.crawl.CrawlDbReader

这样子就能知道方法对应的类。

然后，在Elcipse中导入nutch的整个项目包括源码。在其中，找到需要的类，然后，作为java application来运行。

可以得到以下console内容：

Usage: CrawlDbReader <crawldb> (-stats | -dump <out_dir> | -topN <nnnn> <out_dir> [<min>] | -url <url>)
<crawldb> directory name where crawldb is located
-stats [-sort] print overall statistics to System.out
  [-sort] list status sorted by host
-dump <out_dir> [-format normal|csv ] dump the whole db to a text file in <out_dir>
  [-format csv] dump in Csv format
  [-format normal] dump in standard format (default option)
-url <url> print information on <url> to System.out
-topN <nnnn> <out_dir> [<min>] dump top <nnnn> urls sorted by score to <out_dir>
  [<min>] skip records with scores below this value.
   This can significantly improve performance.

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
如何查看Nutch命令

比如要找readdb的使用方法可以用文本方式打开bin/nutch.sh然后，找到相应的这么一句：elif [ "$COMMAND" = "readdb" ] ; then CLASS=org.apache.nutch.crawl.CrawlDbReader
复制链接

扫一扫

专栏目录

博客等级

码龄16年

94
原创

438
点赞

484
收藏

616
粉丝

关注

私信

热门文章

分类专栏

最新评论

补码综合理解
做而论道_CS: －－－－－－－－－－－－－－　求补码，是极其简单的事！－－－－－－－－－－－－－－真值机器数符号位原码反码取反加一符号位不变模同余 ... 这些，都是毫无用处的。即使，你把专家编造的这些谎话，都背下来了，你也不会理解：“减法怎么就变成加法啦？”。专家写的这些，明显就是【拿个鞋拔子当做玉如意】。假货，不仅仅在古董行业才有啊！
补码综合理解
做而论道_CS: －－【划重点】－－－－－－－－－－实际上，任意负数（－X）的补码，都是：0 － X。你用二进制简单算一下，立刻就能得到结果。（－128 的 8 位补码，也就是这样求出来的。）同理，任意正数（＋X）的补码，也都是：0 ＋ X。 0 ＋ X，不就是 X 吗？即，正数的补码，就是 X 本身！－－－－－－－－－－－－－－－－－
补码综合理解
做而论道_CS: 学习计算机，千万不要学习原码和反码呀！原码反码，都是虚构的。实际上，它们，都是不存在的。学习计算机，首先，要认识到两个概念： 1. 计算机每次计算，位数，是固定的。　八位机，每次，就计算机八个位。 2. 计算机中，只有加法器。　减法（或负数），都必须用加法实现。那么，45－45 = 0，计算机怎么算呢？八位机将如下计算：　　0010 1101 + xxxx xxxx = 0000 0000。其中的：xxxx xxxx，就是【－45 的八位补码】。这个补码，到底是什么？你自己也能推导出来。先移项：xxxx xxxx = 0000 0000－0010 1101，可得出：xxxx xxxx = (借位 1) 1101 0011，取八位：xxxx xxxx = 1101 0011。至此，就求出了 [－45]补 = 1101 0011。求负数的补码，就是这么简单！
补码综合理解
做而论道_CS: 在计算机系统中，数值，一律采用补码表示和存储。数值和补码，直接转换就行了。根本就用不着原码和反码。
补码综合理解
做而论道_CS: 码长八位时，各码的范围如下。原码：－127 ~ +127。反码：－127 ~ +127。补码：－128 ~ +127。注意：－128，没有原码反码，只有补码。补码，是怎么求出来的？没有原码，拿什么取反？没有反码，拿什么加一？

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。