- 博客(5)
- 收藏
- 关注
转载 Crawl the Nutch -- Map Reduce
初见于Google Lab的Paper, http://labs.google.com/papers/mapreduce.html,论文中表明在有大量集群支撑的情况下,可以快速的在海量文档中进行数据处理。现在你有一堆数据,你需要按记录修改、查询、插入和删除,一种办法是你为这些记录建立索引,比如放入数据库,还有一种办法就是--MapReduce。这种处理方式实际上是在数据存放的时候不建立索引,等实
2007-09-26 15:02:00 1250
转载 怎样用JspSmartUpload实现文件上传攻略
㈠ 表单要求 对于上传文件的FORM表单,有两个要求: 1、METHOD应用POST,即METHOD="POST"。 2、增加属性:ENCTYPE="multipart/form-data" 下面是一个用于上传文件的FORM表单的例子: FORM METHOD="POST" ENCTYPE="multipart/form-data" ACT
2007-09-14 21:26:00 1276
转载 MapReduce介绍(转载自张凌云Blog)
MapReduce:超大机群上的简单数据处理 摘要MapReduce是一个编程模型,和处理,产生大数据集的相关实现.用户指定一个map函数处理一个key/value对,从而产生中间的key/value对集.然后再指定一个
2007-09-11 09:51:00 2481 1
转载 基于Lucene站内搜索(转载)
99收藏夹原来的站内收藏搜索是基于数据库的like%%语句,发现速度有点慢,于是想到用Lucene来实现站内收藏的按名字和共享收藏的连接标题来搜索的功能,昨天下午做好了,但是结果有点牵强人意。首先我用Lucene把数据从数据库导出建立索引,代码如下,注:里面的ChinaTokene方法是调用www.sj110.com的中文分词组件 public class IntranetInd
2007-09-04 10:26:00 1034
转载 搜索篇:lucene简单实例 (二) 转自javaeye
Lucene 其实很简单的,它最主要就是做两件事:建立索引和进行搜索 来看一些在lucene中使用的术语,这里并不打算作详细的介绍,只是点一下而已----因为这一个世界有一种好东西,叫搜索。IndexWriter:lucene中最重要的的类之一,它主要是用来将文档加入索引,同时控制索引过程中的一些参数使用。Analyzer:分析器,主要用于分析搜索引擎遇到的各种文本。常用的有Standar
2007-09-03 19:43:00 822
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人