- 博客(6)
- 资源 (1)
- 收藏
- 关注
转载 Lucene:基于Java的全文检索引擎简介
转载自:http://www.chedong.com/tech/lucene.html Lucene是一个基于Java的全文索引工具包。 基于Java的全文索引引擎Lucene简介:关于作者和Lucene的历史全文检索的实现:Luene全文索引和数据库索引的比较中文切分词机制简介:基于词库和自动切分词算法的比较具体的安装和使用简介:系统结构介绍和演示Hacking Lucene
2013-12-20 11:22:26 529
转载 HBase MapReduce实例分析
转载自:http://www.cnblogs.com/NicholasLee/archive/2012/09/14/2685053.html 跟Hadoop的无缝集成使得使用MapReduce对HBase的数据进行分布式计算非常方便,本文将介绍HBase下 MapReduce开发要点。很好理解本文前提是你对Hadoop MapReduce有一定的了解,如果你是初次接触Hadoop M
2013-12-12 15:26:58 2240
转载 hive原生和复合类型的数据加载和使用
转载自:http://www.cnblogs.com/ggjucheng/archive/2013/01/31/2868941.html原生类型原生类型包括TINYINT,SMALLINT,INT,BIGINT,BOOLEAN,FLOAT,DOUBLE,STRING,BINARY (Hive 0.8.0以上才可用),TIMESTAMP (Hive 0.8.0以上才可用),这些数据加载很
2013-12-09 14:41:24 522
原创 Hive+GenericUDF示例二
再来看一个分数统计的小例子。 在Hive中存在如下一张表:hive> describe tb_test2;OKname string score_list array> Time taken: 0.074 secondshive> select * from tb_test2;OKA [{"math":100,"english":90,"history":85}
2013-12-09 14:32:34 2496 1
原创 排序算法示意图
1.冒泡排序(bubble sort) 2.插入排序(insert sort) 3.选择排序(selection sort) 4.合并排序(merge sort) 5.快速排序(quick sort) 6.堆排序(heap sort)
2013-12-06 16:40:07 707
原创 Hive+GenericUDF示例一
和UDF相比,通用GDF(GenericUDF)支持复杂类型(比如List,struct等)的输入和输出。 下面来看一个小示例。 某表中包含若干人的行程如下: A 2013-10-10 8:00:00 homeA 2013-10-10 10:00:00 Super MarketA 201
2013-12-02 14:59:58 3133 2
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人