版本不对导致的问题

今天版本不对导致了这个问题,找了好久,没有知识真可怕 -bash: /home/hadoop/jdk1.7.0_07/bin/java: No such file or directory 看了权限都有 这个问题是由于 linux的版本的是64位的 我的jdk是 32位导致 的....

2012-10-24 11:54:07

阅读数 6

评论数 0

hbase 多集群之间的备份

多集群之间的备份使用CopyTable 参考 http://hbase.apache.org/book/ops_mgt.html#copytable CopyTable is a utility that can copy part or of all of a table, either...

2012-08-11 16:45:55

阅读数 3

评论数 0

nutch SolrDeleteDuplicates

[img]http://dl.iteye.com/upload/attachment/0070/9722/4cd4c22a-aeae-39a3-ad52-26d98b008fc4.jpg[/img] map 使用默认的map InputFormat 负责split数据转换数据 j...

2012-07-19 12:24:02

阅读数 3

评论数 0

nutch SolrIndexer 详解

[img]http://dl.iteye.com/upload/attachment/0070/9707/99759312-b08c-308d-b142-17c8b826763f.jpg[/img] 这个 job的 具体和 nutch1.2 index[url]http://chengqian...

2012-07-18 18:33:07

阅读数 4

评论数 0

nutch1.2 DeleteDuplicates IndexMerger 详解

[img]http://dl.iteye.com/upload/attachment/0070/9571/dc62bf75-a090-399e-bf72-cb1b38a5e7c7.jpg[/img] job 1 map: 默认Mapper , 输出为key:Text ...

2012-07-18 16:31:59

阅读数 4

评论数 0

nutch1.2 index 详解

首先如果存在crawl/index ,crawl/indexes目录则删除 [img]http://dl.iteye.com/upload/attachment/0070/9519/a430b9dc-5f53-30cf-8a29-9fdcfd640db8.jpg[/img] map:Ind...

2012-07-18 15:16:56

阅读数 6

评论数 0

nutch LinkDb invert 详解

LinkDb [img]http://dl.iteye.com/upload/attachment/0070/9396/c9cab6fc-3367-3c31-9baa-1262cee8a7ee.jpg[/img] map :LinkDb 输入目录为segments目录里面所有se...

2012-07-18 14:19:59

阅读数 3

评论数 0

nutch crawdb update 详解

crawdb update [img]http://dl.iteye.com/upload/attachment/0070/9302/e36cc6e0-519e-3a58-8ae0-bdb1eef4840f.jpg[/img] map :CrawlDbFilter 这个map主要是...

2012-07-18 11:01:20

阅读数 5

评论数 0

nutch fetcher详解

fetcher 是生产者和消费者的模式,生产者是QueueFeeder 不断的读取文件,消费者是 FetcherThread 不断的抓取网址 map是输入是crawl/segments/具体的segment/crawl_generate QueueFeeder [img]http:...

2012-07-16 18:04:06

阅读数 8

评论数 0

nutch generator 详解

[img]http://dl.iteye.com/upload/attachment/0070/8228/5e55caae-08ec-3e9b-a2ec-dafacb1773d7.jpg[/img] job1 map Selector 输入目录为crawldb/current...

2012-07-16 15:31:34

阅读数 6

评论数 0

nutch inject 详解

nutch的inject 有二个job 第一个job 如下图 [img]http://dl.iteye.com/upload/attachment/0070/8193/a71b6a19-b4c3-3cd6-90d8-2a490b9a61c9.jpg[/img] map :Inje...

2012-07-16 14:27:21

阅读数 4

评论数 0

nutch 配置文件

NutchConfiguration 类中的初始化 public static Configuration createCrawlConfiguration() { Configuration conf = new Configuration(); addNutchR...

2012-06-27 16:57:52

阅读数 4

评论数 0

fq 的frange查询 为啥会快

fq的frange查询,网上很多原理,其实我觉得一直没有说到原理,fq的frange 查询的快的原因是,他第一次把对应的field的值全部加载到lucene的 fieldcache里面,范围条件的结果会保存到filtercache里面。如果 查询条件命中filtercache,就从filterca...

2012-06-04 15:50:41

阅读数 4

评论数 0

solr 的 Spatial Search

solr Spatial Search schema.xml 定义 在dataimport 的时候需要用到TemplateTransformer db-data-config.xml filed的配置如下 查询一公里内的 ht...

2012-05-30 16:25:47

阅读数 5

评论数 0

nutch 1.4 需要的额外的jar

nekohtml http://nekohtml.sourceforge.net/ dk.brics.automaton http://www.brics.dk/automaton/ rome http://mirrors.ibiblio.org/pub/mirrors/maven2/rome...

2012-05-27 19:58:21

阅读数 4

评论数 0

solr的tdate solrj的xml的时间的格式化

使用solr的时候如果把date类型转换成tlong型数据,非常不方便,写入的时候要转换,返回的时候要转换,查询的时候要转换非常不方便,可以用tdate这个类型,使用这个有关注意事项是solr是用世界标准时间去格式化时间,所以在浏览器中你查询的出来的结果会和你传递的过去的时间不一样 solr...

2012-01-10 20:55:48

阅读数 4

评论数 0

ubuntu下eclipse的svn插件使用javahl

http://www.cnblogs.com/feng_013/archive/2010/07/22/1783228.html

2011-03-28 15:03:36

阅读数 2

评论数 0

python os.sysconf

http://pubs.opengroup.org/onlinepubs/009695399/functions/sysconf.html

2011-01-03 14:59:34

阅读数 14

评论数 0

Implementors

http://eclipse-tools.sourceforge.net/implementors/ eclispe alt+f3

2010-12-09 16:15:07

阅读数 8

评论数 0

OpenBitSet和OpenBitSetIterator在TermRangeQuery中的运用

OpenBitSet和OpenBitSetIterator在TermRangeQuery中的运用 在MultiTermQuery 的rewrite方法中,如果 if (pendingTerms.size() >= termCountLimit || docVisitCount...

2010-11-16 16:06:16

阅读数 6

评论数 0

提示
确定要删除当前文章?
取消 删除
关闭
关闭